Ứng dụng trí tuệ nhân tạo DALL-E: Thuật toán có thể vẽ bất cứ thứ gì bạn yêu cầu

Ứng dụng trí tuệ nhân tạo cho vào những hình vẽ trông khá đơn thuần (mặc dù có những hình rất xinh xắn), nhưng đa số đều cho thấy trí tuệ nhân tạo đang dần đạt được những khả năng giống như con người. Gần đây một thuật toán AI hỉ được tăng trưởng đủ “thông minh” để vẽ vào bất cứ thứ gì theo ý cụm từ người mua.

Có thể bạn quan tâm

Hình vẽ của AI dựa trên gợi ý "chiếc ghế bành hình quả bơ", "chiếc ghế bành trông giống quả bơ" cho thấy khả năng liên kết các khái niệm không liên quan đồng thời vẫn giữ được hình thức của các vật. (Nguồn: OpenAI) — Hình vẽ cụm từ AI nương tựa trên gợi ý “chiếc ghế bành hình quả bơ”, “chiếc ghế bành trông giống quả bơ” cho thấy khả năng liên kết những khái niệm ko liên quan liêu song song vẫn giữ được hình thức cụm từ những vật. (Nguồn: OpenAI)

Những thành tựu ban sơ

OpenAI – một trong suốt những doanh nghiệp hàng đầu trong suốt ngành tăng trưởng trí tuệ nhân tạo hỉ đưa vào chứng cứ vào đầu tháng 1 vừa sang trọng về một bước tiến nhảy vọt: Hình minh họa cụm từ một rỏ củ cải daikon trong suốt cỗ váy tutu đang dắt chó đi dạo.

Bạn Đang Xem: Ứng dụng trí tuệ nhân tạo DALL-E: Thuật toán có thể vẽ bất cứ thứ gì bạn yêu cầu

OpenAI phát hiện ra rằng DALL-E đôi khi có thể chuyển một số hoạt động của con người và các món quần áo sang động vật và các đồ vật vô tri, chẳng hạn như đồ ăn. Gợi ý hình vẽ ở đây là "hình minh họa của một bé củ cải daikon trong bộ váy tutu đang dắt chó đi dạo." (Nguồn: OpenAI) — OpenAI phát hiện vào rằng DALL-Sợ đôi lúc có thể dời một số hoạt động cụm từ con người và những món quần áo sang động vật và những thiết bị vô tri, chẳng hạn vận như đồ tạo vật. Gợi ý hình vẽ ở đây là “hình minh họa của một bé củ cải daikon trong bộ váy tutu đang dắt chó đi dạo.” (Nguồn: OpenAI)

Ngoài vào, “một chú thỏ trong bộ đồ ngủ đang xem TV”, “một chú tôm mặc com-lê đang sử dụng máy tính” và nhiều cách phối hợp kỳ lạ khác – đa số đều được vẽ vày chuỗi thuật toán mới có tên DALL-Sợ. Chương trình này có thể tạo vào nhiều bản vẽ và hình hình nương tựa trên những gợi ý văn bằng văn bản đơn thuần. Trong suốt những ví dử khác, hệ thống này đang tạo vào một xê ri những bức hình trông rất thực nương tựa trên gợi ý “mặt tiền của cửa hàng với từ “openai” viết lách trên đó”.

Những hình vẽ có thể trông khá đơn thuần (một số hình xinh xắn hơn), nhưng đa số đều là tiến cỗ cho thấy trí tuệ nhân tạo đang dần đạt được những khả năng giống như con người.

Đó cũng là một nguyên nhân hoi lo ngại về việc những chương trình như thế này sẽ có khả năng học được những vách kiến cụm từ con người.

Mark Riedl – phó giáo sư tại Trường Khoa học Georgia về Điện toán Tương tác (Mỹ) cho biết: “Text-to-image (tính năng chuyển văn bản thành hình ảnh) rất mạnh mẽ ở chỗ nó mang lại cho người dùng khả năng diễn đạt những gì họ muốn thấy bằng ngôn ngữ. Ngôn ngữ rất phổ cập, trong khi khả năng nghệ thuật là một kỹ năng cần phải học qua thời gian. Nếu ai đó nảy ra ý tưởng tạo nhân vật hoạt hình Pikachu đang cầm gươm ánh sáng – lightsaber, có thể nó sẽ không phải là thứ mà người đó có thể ngồi xuống và vẽ ngay được kể cả khi đó là thứ mà họ có thể giải thích bằng lời.”

Theo doanh nghiệp cho biết, dòng tên DALL-Sợ là tên tháp giữa nghệ sĩ Tây Ban Tổng nha – Salvador Dalí với nhân vật WALL-Sợ cụm từ Pixar, và cũng là sản phẩm kỹ thuật thứ hai cụm từ OpenAI trong suốt vòng có chửa đầy một năm nhưng hỉ hút mắt được nhiều sự lưu ý cụm từ những nhà kỹ thuật. Trước đó doanh nghiệp hỉ phát hành ta Generative Pre-training Transformer 3 hoặc đang gọi là GPT-3 – một trong suốt những trình tạo văn bản chèn tượng và buộc mão con người giống nhất, chỉ với một vài ba từ gợi ý hỉ có thể tạo vào những bài bác văn mạch nhạc.

Trí tuệ nhân tạo ngày càng giống con người hơn (Ảnh: Internet). — Trí tuệ nhân tạo ngày càng giống con người hơn (Hình: Internet).

OpenAI cho biết trưởng DALL-Sợ và GPT-3 đều được huấn luyện văn bằng cỗ dữ liệu khổng lồ bao gồm thông tin tức tiến đánh khai trên Wikipedia và được thi công trên ụ hình mạng neuron biến xáp tiến đánh bố lần thứ 1 vào tháng 12/2017 và được ngợi ca “đặc biệt mang tính cách mạng trong việc xử lý ngôn ngữ tự nhiên”. Tổ chức này hỉ tiến đánh bố gần như thông tin tức kia bản về cách hoạt động cụm từ DALL-Sợ, nhưng khía cạnh chuẩn xác về dữ liệu sử dụng để đào tạo nó vẫn đang là đẩn số.

Và trong suốt đó là trưởng mối ưa chuộng về “bé củ cải” đáng yêu cũng như những phương tiện truyền thông khác được tạo vào vày những hệ thống này. Trong suốt những năm vừa qua, những học làm bộ làm tịch và kia quan liêu giám sát kỹ thuật hỉ đưa vào cảnh báo về dữ liệu được sử dụng để đào tạo những hệ thống này có thể đựng những vách kiến xã họp trong suốt kết trái đầu vào.

Những lo ngại kế bên vấn đề pa tôn giáo đức và xã họp

Xem Thêm : 10 mẫu ốp lưng điện thoại thời thượng được giới trẻ săn lùng nhất hiện nay

Những vấn đề pa cụm từ xã họp có thể ko hiện diện trong suốt một bức vẽ củ cải, nhưng nội dung đựng vách kiến hỉ tiến hành được phát hiện ở những thuật toán có chức năng đưa vào những quyết toan quan yếu như tham dự đoán hành ta vi phạm tội và điểm điểm kỳ thi.

Một nghiên cứu được tiến đánh bố vừa rồi vày những nhà nghiên cứu từ Đại học Stanford và Đại học McMaster cho thấy GPT-3 liên tục có vách kiến đối xử với người Hồi giáo. Trong suốt sắp một phần tư số trường hợp thử nghiệm, “người Hồi giáo” được GPT-3 cho là có tương quan liêu với “kẻ khủng bố”.

“Mặc dù những mối liên hệ giữa người Hồi giáo và bạo loạn này được học trong quá trình đào tạo từ trước, nhưng chúng dường như không được ghi nhớ”, những nhà nghiên cứu tiếp bút, “Đúng hơn thì GPT-3 thể hiện những thành kiến cơ bản theo cách khá sáng tạo, thể hiện khả năng mạnh mẽ của các mô hình ngôn ngữ để biến tấu những nội dung chứa thành kiến theo những cách khác nhau và có thể làm cho chúng khó bị phát hiện và giảm nhẹ hơn.”

Phần mềm dẻo có khả năng tạo hình hình từ văn bản ko phải là mới, nhưng cho tới ni nó chỉ (1) giới hạn vận trong suốt một thể loại nhất toan (chẳng hạn vận như cu chóc và huơ hòe, hoặc chỉ có cu chóc), và (2) chạy khá ọp ẹp. Đương DALL-Sợ lại hoi chèn tượng với khả năng phối hợp những ý tưởng tương đối xử phức tạp.

Chẳng hạn vận như con tù và sên được tạo vào từ đàn hạc này:

DALL-E có thể tạo ra các con vật được tổng hợp từ nhiều ý tưởng khác nhau như nhạc cụ, thực phẩm và đồ gia dụng. Đôi khi DALL-E cũng xem xét cả hình thức của hai đối tượng để tìm ra cách kết hợp chúng. Ví dụ khi được yêu cầu vẽ "một con ốc làm bằng đàn hạc", nó sẽ liên hệ cột của cây đàn với hình xoắn ốc của vỏ ốc. (Nguồn: OpenAI) — DALL-Sợ có thể tạo vào những con vật được tổng hợp từ nhiều ý tưởng khác rau như nhạc cụ, thực phẩm và đồ gia dụng. Đôi lúc DALL-Sợ cũng cân nhắc trưởng hình thức cụm từ hai đối xử tượng để tìm vào cách phối hợp chúng. Ví dử lúc được yêu cầu vẽ “một con ốc làm bằng đàn hạc”, nó sẽ liên lạc trói buộc cụm từ lượng đàn với hình xoắn tù và cụm từ vỏ tù và. (Nguồn: OpenAI)

DALL-Sợ cụm từ OpenAI hiện được cung gấp tiến đánh khai dưới trạng thái bản thử nghiệm trực tuyến nhưng chỉ giới hạn vận trong suốt những cụm từ do doanh nghiệp mua sẵn. Mặc dù những vách tiến đánh nhắc trên là rất chèn tượng và xác thực, nhưng thực khó để xác toan được những điểm yếu và những vấn đề pa liên quan liêu tới tôn giáo đức cụm từ ụ hình lúc ko thể rà soát nhiều từ và ý tưởng hơn.

Riedl cho biết: “Chúng tôi không chắc rằng bản thử nghiệm bị hạn chế như thế này có cản trở việc nhìn ra những kết quả có vấn đề hơn hay không. Trong một số trường hợp, gợi ý hoàn chỉnh sử dụng để tạo ra ảnh cũng tối nghĩa không kém. Nhưng vẫn có mánh để diễn đạt các gợi ý một cách hợp lý và sẽ cho ra kết quả tốt hơn nếu cụm từ đó khiến hệ thống hoạt động hiệu quả hơn”.

Kèm theo đang có những tác động xã họp từ trưởng những trường hợp sử dụng kỹ thuật độc địa hại hoặc những vách kiến vô ý. Trong suốt một bài bác đăng tải trên blog cụm từ tao, OpenAI cho biết những ụ hình như thế này có khả năng hoi hại cho xã họp và phía họ có kế hoạch trong suốt tương lai để rà soát DALL-Sợ có tiếp tay cho những việc đó hoặc ko.

Cam kết cụm từ OpenAI

Người phát ngôn cụm từ OpenAI cho biết: “Thành kiến và sự lạm dụng là những vấn đề quan trọng trong toàn ngành mà OpenAI rất xem trọng như một phần cam kết của phía chúng tôi về việc triển khai trí tuệ nhân tạo một cách an toàn và có trách nhiệm vì lợi ích của toàn nhân loại. Đội ngũ chính sách và an ninh của chúng tôi đang tham gia chặt chẽ vào quá trình nghiên cứu về DALL-E.”

Trí tuệ nhân tạo cũng tiềm ẩn mặt trái (Ảnh: Internet). — Trí tuệ nhân tạo cũng tiềm tàng mặt trái (Hình: Internet).

Xem Thêm : Cách chụp màn hình máy tính đơn giản thuận tiện nhất: Có nhiều cách hơn bạn nghĩ!

Sẽ có nhiều tiềm năng sáng tạo tích cực ví như DALL-Sợ hoạt động trên một xê ri những ý tưởng phối hợp và tạo vào những hình hình ko đựng nội dung có vách kiến và phân biệt đối xử xử. Đó là nó cho phép thuật mọi người tạo vào một hình hình cụ thể nào đó thích hợp với nhu cầu cụm từ họ mà ko cần phải học những kỹ năng nhất toan, tạo điều kiện cho nhiều người tham lam gia sáng tạo hơn mà ko làm những nghệ sĩ nhiều năm kinh nghiệm tự nhiên bị thôi việc.

Riedl nói: “Tôi không tin rằng sản phẩm đầu ra của DALL-E có chất lượng đủ cao để thay thế các họa sĩ vẽ tranh minh họa chẳng hạn, mặc dù nó có thể đẩy nhanh tiến độ của loại hình công việc này.”

Tuy rằng nhiên, tăng tiến độ việc làm cũng đi kèm cặp với một số vấn đề pa riêng cụm từ nó. Mặc dù DALL-Sợ có thể ko làm những họa sĩ hoạt hình thôi việc, nhưng với phần mềm dẻo mới mạnh mẽ thời cũng có thể đủ khả năng để khai thoái thác được rồi.

Riedl lưu ý một số ví dử bao gồm trưởng việc tạo vào nội dung khiêu dâm. Khoa học Deepfake có thể tháp khuôn mặt cụm từ người này lên người khác một cách mượt mà hỉ được sử dụng để tạo vào những hình hình làm bộ làm tịch mà ko có sự đồng ý cụm từ những người có mặt trong suốt đó. Riedl cũng cho biết mọi người có thể sử dụng những từ khóa và cụm từ để tạo vào những hình hình “nhằm mục đích đe dọa, sỉ nhục hoặc làm tổn thương”.

OpenAI cho biết họ hỉ giữ cho DALL-Sợ ko được sử dụng tràn lan với tìm mọi cách đảm biểu kỹ thuật mới cụm từ họ ko bị nướu dụng cho những mục tiêu bất chính.

Tổ chức cho biết: “Chúng tôi cam kết thực hiện các nghiên cứu bổ sung và sẽ không cung cấp rộng rãi DALL-E trước khi xây dựng xong các biện pháp an ninh để giảm thiểu nội dung thành kiến và giải quyết các mối lo ngại khác về sự an toàn”.

Nguồn: Melanie Ehrenkranz

OpenAI DALL · Sợ: Tạo hình hình từ văn bản (Giảng giải bài bác đăng tải trên blog):

Mời bạn xem thêm những bài bác viết lách liên quan liêu:

Hãy theo dõi Kenh7 để cập đất nước của những ninja nhiều thông tin tức hữu ích nhé!

Nguồn: https://kenh7.vn
Danh mục: Công nghệ

Tham khảo: Mọt Reviews