Google đang cho chạy thử nghiệm Trình tạo hình ảnh trí tuệ nhân tạo (AI). Tuy nhiên, vẫn còn khá nhiều nhược điểm đáng nói.

Nổi bật sau trình tạo hình ảnh Firefly 2 AI mới của Adobe và trình tạo hình ảnh DALL-E 3 mới trong ChatGPT Plus (và cung cấp nó thông qua nhà đầu tư/khách hàng Bing Image Creator của Microsoft ), tuần này Google cũng đã công bố đưa tính năng AI chuyển văn bản thành hình ảnh trực tiếp vào Google Tìm kiếm. Tuy nhiên, chỉ dành cho những người chọn tham gia Trải nghiệm tạo tìm kiếm (SGE) trong Google Search Labs – dịch vụ thử nghiệm beta thử nghiệm của công ty.

“Chúng tôi tin rằng AI có tính sáng tạo trong Tìm kiếm có thể giúp khơi dậy nguồn cảm hứng và giúp bạn làm được nhiều việc hơn nữa. Chúng tôi mong muốn được tiếp tục thử nghiệm và nhận được phản hồi của người dùng,” Hema Budaraju, giám đốc cấp cao về quản lý sản phẩm tại Google Search, viết trong một bài đăng trên blog chính thức của công ty.

Không chỉ vậy, Google còn tiết lộ một tính năng mới cho phép người dùng soạn thảo văn bản theo phong cách Google Docs bằng cách sử dụng AI trong Tìm kiếm. Sau đó, chúng có thể được xuất sang Gmail hoặc Google Docs. 

Có tiềm năng, nhưng hiện tại quyền truy cập bị hạn chế

Người phát ngôn của Google cho rằng khả năng tạo hình ảnh mới được hỗ trợ bởi Imagen – mô hình nền tảng tạo hình ảnh AI độc quyền của Google. Nó đã có sẵn từ tháng 5 thông qua môi trường triển khai và phát triển Google Cloud AI Vertex, nhưng điều đó yêu cầu phải có thẻ tín dụng để truy cập (mặc dù lần sử dụng ban đầu là miễn phí).

Google cũng đã đăng một ảnh GIF động thú vị và dễ thương về cách sử dụng trình tạo hình ảnh tìm kiếm mới AI trong Tìm kiếm để tạo ra một số phiên bản của chuột lang nước đội mũ đầu bếp, chỉ bằng cách người dùng gõ “vẽ hình ảnh của…” và mô tả của hình ảnh mong muốn vào thanh tìm kiếm.

Tuy nhiên, VentureBeat khi chọn tham gia trải nghiệm Search Labs thông qua liên kết được cung cấp trong bài đăng trên blog của Google vào thứ Sáu, vẫn chưa thể tạo hình ảnh như mô tả.

Khi được hỏi về việc thiếu tính khả dụng, người phát ngôn của Google đã lưu ý qua email: “Chúng tôi đã thông báo rằng những khả năng này mới bắt đầu được triển khai bắt đầu từ hôm qua, vì vậy nếu bạn chưa thực hiện được, vui lòng giữ lại để mắt tới :).”

Công bằng mà nói, nó tương tự như những gì OpenAI đã làm với ChatGPT và quá trình triển khai khả năng hình ảnh và âm thanh chậm, kéo dài hai tuần.

Khi được hỏi liệu tính năng tạo hình ảnh có khả dụng rộng rãi trong Google Tìm kiếm hay không, ngoài tính năng chọn tham gia của Search Labs/SGE, người phát ngôn của Google đã viết: “SGE là một thử nghiệm chọn tham gia có sẵn trong Search Labs, đây là một chương trình mới dành cho mọi người thử nghiệm các sản phẩm và ý tưởng mới táo bạo mà chúng tôi đang khám phá. Phòng thí nghiệm tìm kiếm có sẵn trong ứng dụng Google (Android và iOS) và trên máy tính để bàn Chrome.”

Vì vậy…không có mốc thời gian xác định về điều đó.

Thật không may, bất kỳ sự nhầm lẫn nào về việc ai có thể truy cập tính năng tạo hình ảnh AI trong Google Tìm kiếm và bằng cách nào, có lẽ không phải là khởi đầu tuyệt vời cho tính năng đó đối với Google, đặc biệt là khi có rất nhiều trình tạo hình ảnh AI cạnh tranh khác đã có mặt trên thị trường và tất cả người dùng đều có thể dễ dàng truy cập.

Google vẫn đang chơi trò đuổi bắt khi nói đến AI

Tháng trước, Google đã cập nhật chatbot AI Bard — được hỗ trợ bởi mô hình ngôn ngữ lớn (LLM) nền tảng PaLM 2 — để cung cấp khả năng tích hợp với các sản phẩm Google Apps khác, chẳng hạn như Gmail và Drive. Tuy nhiên, thử nghiệm của VentureBeat về các tích hợp mới đã tạo ra kết quả mờ nhạt. Và một báo cáo mới từ tạp chí Fortune cho thấy bản thân nhân viên Google không hài lòng với sản phẩm này và bày tỏ sự nghi ngờ nội bộ về tính hữu dụng của nó, thậm chí một số người thậm chí còn đặt câu hỏi về lợi ích chung của LLM.

Trong khi đó, OpenAI được báo cáo đã vượt qua 1,3 tỷ USD doanh thu hàng năm, phần lớn nhờ vào sự thành công của sản phẩm AI đặc trưng của họ: ChatGPT do LLM cung cấp, cung cấp gói đăng ký cá nhân và doanh nghiệp 20 USD mỗi tháng, cũng như API trả phí .

Và tuần này trên khắp X đã đăng nhiều ví dụ về cách GPT-4V hoặc mô hình tầm nhìn mới của công ty — hỗ trợ phiên bản ChatGPT mới nhất với khả năng phân tích hình ảnh và âm thanh — đã mang lại kết quả thực sự ấn tượng và hữu ích.Cuối cùng, chúng ta hãy cùng chờ sự ra mắt công khai của mô hình nền tảng AI mới được quảng cáo rầm rộ của Google, Gemini nhằm mục đích trở nên “có khả năng hơn” so với ChatGPT .

Theo Venturebeat