Google uvádí, že Gemini je první model umělé inteligence, který předčil lidské expertní dovednosti v určitých oblastech, včetně řešení problémů, matematiky, fyziky, historie, práva, medicíny a etiky. Google popisuje Gemini jako flexibilní model, který může běžet na všech zařízeních od datových center až po mobilní telefony. Model bude mít tři verze: běžné úkoly bude řešit verze Pro, pro chytré telefony bude přizpůsobena varianta Nano a pro vysoce složití úkoly bude sloužit verze Ultra, jež by měla být představena v příštím roce.
Bard s Gemini bude nejprve dostupný v angličtině ve více než 170 zemích a bude schopen pracovat s vizuálními a zvukovými vstupy. Postupně by měla být podpora rozšířena o další jazyky. Uživatelé budou moci například nahrát obrázek nebo video a požádat systém, aby napsal báseň na základě vizuálního vstupu. Gemini bude rovněž integrován do internetového vyhledávače Google.
Přestože generativní AI je stále populárnější, tak je dlouhodobý dopad této technologie nejistý. Technologičtí giganti včetně Googlu a Microsoftu však věří, že generativní AI je klíčovým směrem technologického vývoje.
Gemini 🤝 Bard
— Google (@Google) December 6, 2023
Starting today, our specifically tuned version of Gemini Pro is available in Bard, unlocking new ways to collaborate with AI. Next year, we’re introducing Bard Advanced with Gemini Ultra for even more complex tasks. Learn more ↓ #GeminiAI https://t.co/hEPbj9faHr
These demos all show examples of “multimodal prompting” — giving Gemini combinations of different modalities and having Gemini respond. Here’s how we made them — and some ideas for your own multimodal prompts. https://t.co/9Dh1EFitKM
— Google (@Google) December 6, 2023
Gemini is also one of the world’s leading foundation models for coding.
— Google DeepMind (@GoogleDeepMind) December 6, 2023
It can understand, explain, and generate high-quality code in programming languages like Python, Java, C++, and Go. https://t.co/mwHZTDTBuG pic.twitter.com/MseIT42CIB