PANews 12月12日消息,據Google官方博客,谷歌發佈新一代人工智能模型Gemini 2.0。Gemini 2.0支持文本、圖像、視頻、音頻等多模態輸入,具備原生圖像生成、多語言文本轉語音(TTS)等多模態輸出功能。相較Gemini 1.5 Pro,模型速度提升至兩倍,並優化多模態推理、復雜指令執行和工具使用能力,支持調用Google搜索、代碼執行和第三方功能。
實驗版本Gemini 2.0 Flash現已向開發者開放,2025年1月將全面推廣多模態功能,並推出多模態實時API,為開發者提供更多應用支持。
内容來源:PANews