Perbaruan ChatGPT: Melakukan Percakapan Suara dengan Pengguna dan Berinteraksi Menggunakan Gambar
RIAU24.COM - ChatGPT OpenAI siap untuk pembaruan besar, yang akan memungkinkan chatbot untuk melakukan percakapan suara dengan pengguna dan berinteraksi menggunakan gambar.
Pembaruan akan memindahkannya lebih dekat ke asisten kecerdasan buatan (AI) populer seperti Siri Apple, Alexa Amazon, Bixby Samsung, dan lainnya.
Dalam sebuah posting blog pada hari Senin (25 September), OpenAI mengatakan bahwa fitur suara membuka pintu ke banyak aplikasi kreatif dan berfokus pada aksesibilitas.
"Kami mulai meluncurkan kemampuan suara dan gambar baru di ChatGPT. Mereka menawarkan jenis antarmuka baru yang lebih intuitif dengan memungkinkan Anda melakukan percakapan suara atau menunjukkan ChatGPT apa yang Anda bicarakan," tulis postingan tersebut.
Perusahaan mengatakan bahwa suara dan gambar akan memberi pengguna lebih banyak cara untuk menggunakan ChatGPT dalam kehidupan sehari-hari.
Misalnya, seseorang dapat mengambil gambar tengara saat bepergian dan melakukan percakapan langsung dengan chatbot tentang apa yang menarik tentangnya.
Perusahaan juga memberikan contoh seperti setelah makan malam, versi lanjutan dari chatbot akan membantu anak dengan masalah matematika dengan mengambil foto, mengitari set masalah, dan memilikinya berbagi petunjuk dengan Anda berdua.
Saat ini, layanan AI serupa seperti Siri dan Alexa terintegrasi dengan perangkat yang mereka jalankan. Mereka sering digunakan untuk mengatur alarm dan pengingat dan menyampaikan informasi dari internet.
OpenAI mengatakan bahwa mereka meluncurkan suara dan gambar di ChatGPT ke pengguna Plus dan Enterprise selama dua minggu ke depan.
Suara akan datang di iOS dan Android (ikut serta dalam pengaturan Anda) dan gambar akan tersedia di semua platform.
Bagaimana cara memperbarui aplikasi?
Perusahaan mengatakan bahwa untuk memulai dengan suara, buka Pengaturan → Fitur Baru di aplikasi seluler dan ikut serta dalam percakapan suara. Kemudian, ketuk tombol headphone yang terletak di sudut kanan atas layar beranda dan pilih suara pilihan Anda dari lima suara berbeda.
OpenAI mengatakan dalam posting bahwa kemampuan suara baru didukung oleh model text-to-speech baru, yang mampu menghasilkan audio seperti manusia hanya dari teks dan beberapa detik contoh ucapan.
"Kami berkolaborasi dengan aktor suara profesional untuk menciptakan masing-masing suara. Kami juga menggunakan Whisper, sistem pengenalan suara open-source kami, untuk mentranskripsikan kata-kata yang Anda ucapkan ke dalam teks," katanya.
Sementara itu, pemahaman gambar didukung oleh multimodal GPT-3.5 dan GPT-4. Model-model ini menerapkan keterampilan penalaran bahasa mereka ke berbagai gambar.
Posting blog mengatakan bahwa sekarang, pengguna dapat menampilkan ChatGPT satu atau lebih gambar dan bertanya tentang masalah mereka.
Misalnya, seseorang dapat memecahkan masalah mengapa panggangan tidak mau mulai, menjelajahi isi lemari es untuk merencanakan makanan, atau menganalisis grafik kompleks untuk data terkait pekerjaan.
(***)