
GOOGLE telah meluncurkan fitur terbaru dalam layanan kecerdasan buatan (artificial intelligence/AI) generatif Gemini, yaitu video real-time. Dengan adanya fitur tersebut, pengguna bisa berinteraksi langsung dengan AI menggunakan kamera ponsel pintar untuk melakukan tanya jawab.
Fitur video real-time Gemini memungkinkan AI untuk mengakses dan menganalisis gambar yang ditampilkan melalui kamera ponsel dari pengguna. Sehingga pengguna yang menggunakan fitur video real-time dari Gemini bisa menampilkan visual secara langsung dari kamera ponsel pintar mereka dan meminta asisten AI tersebut menjawab pertanyaan terkait visual yang ditampilkan di layar ponsel pintar mereka.
Fitur video real-time telah hadir hampir satu tahun setelah Google mengembangkan proyek Astra. Proyek tersebut merupakan sebuah riset untuk mengeksplorasi kemampuan asisten AI memahami dunia sekitar pengguna.
Terkait cara kerjanya, pengguna bisa melihat panduan cara kerja video real-time Gemini melalui sebuah video berjudul Gemini Live with Video yang dirilis di Youtube resmi Google pada awal Maret 2025, yang bertepatan dengan pengenalan fitur tersebut ketika MWC berlangsung.
Pada video tersebut, pengguna memperlihatkan sejumlah barang dan menanyakan secara langsung seputar warna yang cocok, asisten AI pun menjawab pertanyaan tersebut berdasarkan visual yang ditampilkan di layar ponsel pintar pengguna.
Fitur Tambahan
Kemampuan membaca dan menganalisis gambar dari layar ini ialah salah satu dari dua fitur utama yang dijanjikan oleh Google di Mobile World Congress (MWC) yang berlangsung di Maret 2025. Pada kesempatan itu, Google juga mengungkapkan bahwa fitur tersebut mulai dirilis secara bertahap kepada sebagian pelanggan Gemini Advanced.
Selain itu, ada pula fitur lainnya yang telah diperkenalkan Google seperti fitur Share Screen with Live, yang membantu pengguna untuk berbagi tampilan layar secara langsung dengan AI.
Kemudian, ada fitur seperti Canvas, yang membantu pengguna untuk mengedit dokumen dan kode. Lalu, fitur lainnya ialah Audio Overview, yang membantu pengguna untuk mengonversi dokumen tertulis, slide presentasi, dan laporan penelitian menjadi diskusi audio ala podcast. (M-1)