Google ve Alphabet CEO'su Sundar Pichai'den bir not:
Her teknoloji değişimi bilimsel keşifleri ilerletmek, insanlığın ilerlemesini hızlandırmak ve yaşamları iyileştirmek için bir fırsattır. yapay zekada şu anda görmekte olduğumuz geçişin hayatımızdaki en derin geçiş olacağına inanıyorum; mobil veya web'e geçişten çok daha büyük. Yapay zeka, dünyanın her yerindeki insanlar için gündelikten olağanüstüye kadar fırsatlar yaratma potansiyeline sahiptir. Yeni inovasyon ve ekonomik ilerleme dalgaları getirecek ve bilgiyi, öğrenmeyi, yaratıcılığı ve üretkenliği daha önce görmediğimiz bir ölçekte artıracak.
Beni heyecanlandıran da bu: Yapay zekayı dünyanın her yerinde herkes için yararlı kılma şansı.
Yapay zekaya öncelik veren bir şirket olarak yolculuğumuza neredeyse sekiz yıl kala, ilerlemenin hızı giderek artıyor: Milyonlarca insan, artık bir yıl önce bile yapamadıkları şeyleri yapmak için ürünlerimizde üretken yapay zekayı kullanıyor; daha karmaşık soruların yanıtlarını bulmaktan İşbirliği yapmak ve yaratmak için yeni araçların kullanımına ilişkin sorular. Aynı zamanda geliştiriciler, yeni üretken yapay zeka uygulamaları geliştirmek için modellerimizi ve altyapımızı kullanıyor ve dünya çapındaki yeni girişimler ve kuruluşlar, yapay zeka araçlarımızla büyüyor.
Bu inanılmaz bir ivme ve henüz mümkün olanın yalnızca yüzeyini çizmeye başlıyoruz.
Bu işe cesurca ve sorumlu bir şekilde yaklaşıyoruz. Bu, araştırmamızda iddialı olmak ve insanlara ve topluma muazzam faydalar sağlayacak yeteneklerin peşinde koşmak, aynı zamanda yapay zeka daha yetenekli hale geldikçe riskleri ele almak için güvenlik önlemleri oluşturmak ve hükümetler ve uzmanlarla işbirliği içinde çalışmak anlamına geliyor. Yapay Zeka İlkelerimizin rehberliğinde en iyi araçlara, temel modellere ve altyapıya yatırım yapmaya ve bunları ürünlerimize ve diğerlerine sunmaya devam ediyoruz .
Şimdi, şimdiye kadarki en yetenekli ve genel modelimiz olan ve önde gelen pek çok kriterde en son teknolojiye sahip performansa sahip olan Gemini ile yolculuğumuzda bir sonraki adımı atıyoruz. İlk sürümümüz Gemini 1.0 farklı boyutlar için optimize edilmiştir: Ultra, Pro ve Nano. Bunlar Gemini döneminin ilk modelleri ve bu yılın başlarında Google DeepMind'ı kurduğumuzda sahip olduğumuz vizyonun ilk hayata geçirilmesidir. Bu yeni model çağı, şirket olarak üstlendiğimiz en büyük bilim ve mühendislik çalışmalarından birini temsil ediyor. Gelecek ve Gemini'nin dünyanın her yerindeki insanlar için açacağı fırsatlar konusunda gerçekten heyecanlıyım.
– Sundar
İkizler burcuyla tanışın
Gemini ekibi adına Google DeepMind CEO'su ve Kurucu Ortağı Demis Hassabis tarafından yazılmıştır.
Yapay zeka, birçok araştırma arkadaşım gibi benim de hayatım boyunca yaptığım işin odak noktası oldu. Gençliğimde bilgisayar oyunları için yapay zeka programladığımdan beri ve beynin işleyişini anlamaya çalışan bir sinirbilim araştırmacısı olarak geçirdiğim yıllar boyunca, eğer daha akıllı makineler yapabilirsek, onları insanlığa inanılmaz derecede fayda sağlayacak şekilde kullanabileceğimize her zaman inandım. yollar.
Yapay zeka tarafından sorumlu bir şekilde desteklenen bir dünya vaadi, Google DeepMind'daki çalışmalarımızı yönlendirmeye devam ediyor. Uzun zamandır insanların dünyayı anlama ve onunla etkileşim kurma biçiminden ilham alan yeni nesil yapay zeka modelleri oluşturmak istiyorduk. Akıllı bir yazılımdan ziyade kullanışlı ve sezgisel bir şeye benzeyen yapay zeka, uzman bir yardımcı veya asistan.
Bugün şimdiye kadar ürettiğimiz en yetenekli ve genel model olan Gemini'yi tanıtırken bu vizyona bir adım daha yaklaştık .
Gemini, Google Araştırma'daki meslektaşlarımız da dahil olmak üzere Google'daki ekiplerin büyük ölçekli ortak çabalarının sonucudur. Sıfırdan çok modlu olacak şekilde inşa edilmiştir; bu, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebileceği ve sorunsuz bir şekilde anlayabileceği, bunlar üzerinde çalışabileceği ve birleştirebileceği anlamına gelir.
4:35
Gemini ile tanışın: en büyük ve en yetenekli yapay zeka modelimiz
Gemini aynı zamanda şimdiye kadarki en esnek modelimizdir; veri merkezlerinden mobil cihazlara kadar her şeyi verimli bir şekilde çalıştırabilir. En son teknolojiye sahip yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile oluşturma ve ölçeklendirme yöntemlerini önemli ölçüde geliştirecek.
İlk versiyonumuz olan Gemini 1.0'ı üç farklı boyut için optimize ettik:
Gemini Ultra — son derece karmaşık görevler için en büyük ve en yetenekli modelimiz.
Gemini Pro — çok çeşitli görevleri ölçeklendirmek için en iyi modelimiz.
Gemini Nano — cihaz içi görevler için en verimli modelimiz.
Son teknoloji performans
Gemini modellerimizi titizlikle test ediyoruz ve çok çeşitli görevlerdeki performanslarını değerlendiriyoruz. Gemini Ultra'nın doğal görüntü, ses ve video anlayışından matematiksel akıl yürütmeye kadar performansı, büyük dil modeli (LLM) araştırma ve geliştirmesinde kullanılan yaygın olarak kullanılan 32 akademik kriterin 30'unda mevcut en son sonuçları aşmaktadır.
Gemini Ultra, %90,0 puanla matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konunun bir kombinasyonunu kullanarak hem dünyayı hem de dünyayı test eden MMLU (büyük çoklu görev dil anlayışı) konusunda insan uzmanlarından daha iyi performans gösteren ilk modeldir. bilgi ve problem çözme yetenekleri.
MMLU'ya yönelik yeni kıyaslama yaklaşımımız, Gemini'nin zor soruları yanıtlamadan önce akıl yürütme yeteneklerini daha dikkatli kullanmasına olanak tanıyarak, yalnızca ilk izlenimi kullanmaya göre önemli gelişmelere yol açar.
Gemini, metin ve kodlama da dahil olmak üzere bir dizi kıyaslamada son teknoloji performansı geride bırakıyor.
Gemini Ultra also achieves a state-of-the-art score of 59.4% on the new MMMU benchmark, which consists of multimodal tasks spanning different domains requiring deliberate reasoning.
With the image benchmarks we tested, Gemini Ultra outperformed previous state-of-the-art models, without assistance from optical character recognition (OCR) systems that extract text from images for further processing. These benchmarks highlight Gemini’s native multimodality and indicate early signs of Gemini's more complex reasoning abilities.
See more details in our Gemini technical report.
Gemini surpasses state-of-the-art performance on a range of multimodal benchmarks.
Next-generation capabilities
Until now, the standard approach to creating multimodal models involved training separate components for different modalities and then stitching them together to roughly mimic some of this functionality. These models can sometimes be good at performing certain tasks, like describing images, but struggle with more conceptual and complex reasoning.
We designed Gemini to be natively multimodal, pre-trained from the start on different modalities. Then we fine-tuned it with additional multimodal data to further refine its effectiveness. This helps Gemini seamlessly understand and reason about all kinds of inputs from the ground up, far better than existing multimodal models — and its capabilities are state of the art in nearly every domain.
Learn more about Gemini’s capabilities and see how it works.
Sophisticated reasoning
Gemini 1.0’s sophisticated multimodal reasoning capabilities can help make sense of complex written and visual information. This makes it uniquely skilled at uncovering knowledge that can be difficult to discern amid vast amounts of data.
Its remarkable ability to extract insights from hundreds of thousands of documents through reading, filtering and understanding information will help deliver new breakthroughs at digital speeds in many fields from science to finance.
2:43
Gemini unlocks new scientific insights
Understanding text, images, audio and more
Gemini 1.0 was trained to recognize and understand text, images, audio and more at the same time, so it better understands nuanced information and can answer questions relating to complicated topics. This makes it especially good at explaining reasoning in complex subjects like math and physics.
1:59
Gemini explains reasoning in math and physics
Advanced coding
Our first version of Gemini can understand, explain and generate high-quality code in the world’s most popular programming languages, like Python, Java, C++, and Go. Its ability to work across languages and reason about complex information makes it one of the leading foundation models for coding in the world.
Gemini Ultra excels in several coding benchmarks, including HumanEval, an important industry-standard for evaluating performance on coding tasks, and Natural2Code, our internal held-out dataset, which uses author-generated sources instead of web-based information.
Gemini can also be used as the engine for more advanced coding systems. Two years ago we presented AlphaCode, the first AI code generation system to reach a competitive level of performance in programming competitions.
Using a specialized version of Gemini, we created a more advanced code generation system, AlphaCode 2, which excels at solving competitive programming problems that go beyond coding to involve complex math and theoretical computer science.
5:01
Gemini excels at coding and competitive programming
When evaluated on the same platform as the original AlphaCode, AlphaCode 2 shows massive improvements, solving nearly twice as many problems, and we estimate that it performs better than 85% of competition participants — up from nearly 50% for AlphaCode. When programmers collaborate with AlphaCode 2 by defining certain properties for the code samples to follow, it performs even better.
We’re excited for programmers to increasingly use highly capable AI models as collaborative tools that can help them reason about the problems, propose code designs and assist with implementation — so they can release apps and design better services, faster.
See more details in our AlphaCode 2 technical report.
More reliable, scalable and efficient
We trained Gemini 1.0 at scale on our AI-optimized infrastructure using Google’s in-house designed Tensor Processing Units (TPUs) v4 and v5e. And we designed it to be our most reliable and scalable model to train, and our most efficient to serve.
On TPUs, Gemini runs significantly faster than earlier, smaller and less-capable models. These custom-designed AI accelerators have been at the heart of Google's AI-powered products that serve billions of users like Search, YouTube, Gmail, Google Maps, Google Play and Android. They’ve also enabled companies around the world to train large-scale AI models cost-efficiently.
Today, we’re announcing the most powerful, efficient and scalable TPU system to date, Cloud TPU v5p, designed for training cutting-edge AI models. This next generation TPU will accelerate Gemini’s development and help developers and enterprise customers train large-scale generative AI models faster, allowing new products and capabilities to reach customers sooner.
A row of Cloud TPU v5p AI accelerator supercomputers in a Google data center.
Built with responsibility and safety at the core
At Google, we’re committed to advancing bold and responsible AI in everything we do. Building upon Google’s AI Principles and the robust safety policies across our products, we’re adding new protections to account for Gemini’s multimodal capabilities. At each stage of development, we’re considering potential risks and working to test and mitigate them.
Gemini has the most comprehensive safety evaluations of any Google AI model to date, including for bias and toxicity. We’ve conducted novel research into potential risk areas like cyber-offense, persuasion and autonomy, and have applied Google Research’s best-in-class adversarial testing techniques to help identify critical safety issues in advance of Gemini’s deployment.
To identify blindspots in our internal evaluation approach, we’re working with a diverse group of external experts and partners to stress-test our models across a range of issues.
To diagnose content safety issues during Gemini’s training phases and ensure its output follows our policies, we’re using benchmarks such as Real Toxicity Prompts, a set of 100,000 prompts with varying degrees of toxicity pulled from the web, developed by experts at the Allen Institute for AI. Further details on this work are coming soon.
To limit harm, we built dedicated safety classifiers to identify, label and sort out content involving violence or negative stereotypes, for example. Combined with robust filters, this layered approach is designed to make Gemini safer and more inclusive for everyone. Additionally, we’re continuing to address known challenges for models such as factuality, grounding, attribution and corroboration.
Responsibility and safety will always be central to the development and deployment of our models. This is a long-term commitment that requires building collaboratively, so we’re partnering with the industry and broader ecosystem on defining best practices and setting safety and security benchmarks through organizations like MLCommons, the Frontier Model Forum and its AI Safety Fund, and our Secure AI Framework (SAIF), which was designed to help mitigate security risks specific to AI systems across the public and private sectors. We’ll continue partnering with researchers, governments and civil society groups around the world as we develop Gemini.
Making Gemini available to the world
Gemini 1.0 is now rolling out across a range of products and platforms:
Gemini Pro in Google products
We’re bringing Gemini to billions of people through Google products.
Starting today, Bard will use a fine-tuned version of Gemini Pro for more advanced reasoning, planning, understanding and more. This is the biggest upgrade to Bard since it launched. It will be available in English in more than 170 countries and territories, and we plan to expand to different modalities and support new languages and locations in the near future.
We’re also bringing Gemini to Pixel. Pixel 8 Pro is the first smartphone engineered to run Gemini Nano, which is powering new features like Summarize in the Recorder app and rolling out in Smart Reply in Gboard, starting with WhatsApp, Line and KakaoTalk1 — with more messaging apps coming next year.
In the coming months, Gemini will be available in more of our products and services like Search, Ads, Chrome and Duet AI.
We’re already starting to experiment with Gemini in Search, where it's making our Search Generative Experience (SGE) faster for users, with a 40% reduction in latency in English in the U.S., alongside improvements in quality.
Building with Gemini
Starting on December 13, developers and enterprise customers can access Gemini Pro via the Gemini API in Google AI Studio or Google Cloud Vertex AI.
Google AI Studio is a free, web-based developer tool to prototype and launch apps quickly with an API key. When it's time for a fully-managed AI platform, Vertex AI allows customization of Gemini with full data control and benefits from additional Google Cloud features for enterprise security, safety, privacy and data governance and compliance.
Android developers will also be able to build with Gemini Nano, our most efficient model for on-device tasks, via AICore, a new system capability available in Android 14, starting on Pixel 8 Pro devices. Sign up for an early preview of AICore.
Gemini Ultra coming soon
For Gemini Ultra, we’re currently completing extensive trust and safety checks, including red-teaming by trusted external parties, and further refining the model using fine-tuning and reinforcement learning from human feedback (RLHF) before making it broadly available.
As part of this process, we’ll make Gemini Ultra available to select customers, developers, partners and safety and responsibility experts for early experimentation and feedback before rolling it out to developers and enterprise customers early next year.
Early next year, we’ll also launch Bard Advanced, a new, cutting-edge AI experience that gives you access to our best models and capabilities, starting with Gemini Ultra.
The Gemini era: enabling a future of innovation
This is a significant milestone in the development of AI, and the start of a new era for us at Google as we continue to rapidly innovate and responsibly advance the capabilities of our models.
Gemini'de şu ana kadar büyük ilerleme kaydettik ve planlama ve bellekteki ilerlemeler ve daha iyi yanıtlar vermek üzere daha fazla bilgi işlemek için bağlam penceresini artırmak da dahil olmak üzere gelecekteki sürümler için yeteneklerini daha da genişletmek için çok çalışıyoruz.
Yaratıcılığı artıracak, bilgiyi genişletecek, bilimi ilerletecek ve dünya çapında milyarlarca insanın yaşama ve çalışma biçimini dönüştürecek bir inovasyon geleceği olan yapay zeka tarafından sorumlu bir şekilde desteklenen bir dünyanın inanılmaz olanakları bizi heyecanlandırıyor.Van Gazetesi - Van Haber - vanhaber
Her teknoloji değişimi bilimsel keşifleri ilerletmek, insanlığın ilerlemesini hızlandırmak ve yaşamları iyileştirmek için bir fırsattır. yapay zekada şu anda görmekte olduğumuz geçişin hayatımızdaki en derin geçiş olacağına inanıyorum; mobil veya web'e geçişten çok daha büyük. Yapay zeka, dünyanın her yerindeki insanlar için gündelikten olağanüstüye kadar fırsatlar yaratma potansiyeline sahiptir. Yeni inovasyon ve ekonomik ilerleme dalgaları getirecek ve bilgiyi, öğrenmeyi, yaratıcılığı ve üretkenliği daha önce görmediğimiz bir ölçekte artıracak.
Beni heyecanlandıran da bu: Yapay zekayı dünyanın her yerinde herkes için yararlı kılma şansı.
Yapay zekaya öncelik veren bir şirket olarak yolculuğumuza neredeyse sekiz yıl kala, ilerlemenin hızı giderek artıyor: Milyonlarca insan, artık bir yıl önce bile yapamadıkları şeyleri yapmak için ürünlerimizde üretken yapay zekayı kullanıyor; daha karmaşık soruların yanıtlarını bulmaktan İşbirliği yapmak ve yaratmak için yeni araçların kullanımına ilişkin sorular. Aynı zamanda geliştiriciler, yeni üretken yapay zeka uygulamaları geliştirmek için modellerimizi ve altyapımızı kullanıyor ve dünya çapındaki yeni girişimler ve kuruluşlar, yapay zeka araçlarımızla büyüyor.
Bu inanılmaz bir ivme ve henüz mümkün olanın yalnızca yüzeyini çizmeye başlıyoruz.
Bu işe cesurca ve sorumlu bir şekilde yaklaşıyoruz. Bu, araştırmamızda iddialı olmak ve insanlara ve topluma muazzam faydalar sağlayacak yeteneklerin peşinde koşmak, aynı zamanda yapay zeka daha yetenekli hale geldikçe riskleri ele almak için güvenlik önlemleri oluşturmak ve hükümetler ve uzmanlarla işbirliği içinde çalışmak anlamına geliyor. Yapay Zeka İlkelerimizin rehberliğinde en iyi araçlara, temel modellere ve altyapıya yatırım yapmaya ve bunları ürünlerimize ve diğerlerine sunmaya devam ediyoruz .
Şimdi, şimdiye kadarki en yetenekli ve genel modelimiz olan ve önde gelen pek çok kriterde en son teknolojiye sahip performansa sahip olan Gemini ile yolculuğumuzda bir sonraki adımı atıyoruz. İlk sürümümüz Gemini 1.0 farklı boyutlar için optimize edilmiştir: Ultra, Pro ve Nano. Bunlar Gemini döneminin ilk modelleri ve bu yılın başlarında Google DeepMind'ı kurduğumuzda sahip olduğumuz vizyonun ilk hayata geçirilmesidir. Bu yeni model çağı, şirket olarak üstlendiğimiz en büyük bilim ve mühendislik çalışmalarından birini temsil ediyor. Gelecek ve Gemini'nin dünyanın her yerindeki insanlar için açacağı fırsatlar konusunda gerçekten heyecanlıyım.
– Sundar
İkizler burcuyla tanışın
Gemini ekibi adına Google DeepMind CEO'su ve Kurucu Ortağı Demis Hassabis tarafından yazılmıştır.
Yapay zeka, birçok araştırma arkadaşım gibi benim de hayatım boyunca yaptığım işin odak noktası oldu. Gençliğimde bilgisayar oyunları için yapay zeka programladığımdan beri ve beynin işleyişini anlamaya çalışan bir sinirbilim araştırmacısı olarak geçirdiğim yıllar boyunca, eğer daha akıllı makineler yapabilirsek, onları insanlığa inanılmaz derecede fayda sağlayacak şekilde kullanabileceğimize her zaman inandım. yollar.
Yapay zeka tarafından sorumlu bir şekilde desteklenen bir dünya vaadi, Google DeepMind'daki çalışmalarımızı yönlendirmeye devam ediyor. Uzun zamandır insanların dünyayı anlama ve onunla etkileşim kurma biçiminden ilham alan yeni nesil yapay zeka modelleri oluşturmak istiyorduk. Akıllı bir yazılımdan ziyade kullanışlı ve sezgisel bir şeye benzeyen yapay zeka, uzman bir yardımcı veya asistan.
Bugün şimdiye kadar ürettiğimiz en yetenekli ve genel model olan Gemini'yi tanıtırken bu vizyona bir adım daha yaklaştık .
Gemini, Google Araştırma'daki meslektaşlarımız da dahil olmak üzere Google'daki ekiplerin büyük ölçekli ortak çabalarının sonucudur. Sıfırdan çok modlu olacak şekilde inşa edilmiştir; bu, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebileceği ve sorunsuz bir şekilde anlayabileceği, bunlar üzerinde çalışabileceği ve birleştirebileceği anlamına gelir.
4:35
Gemini ile tanışın: en büyük ve en yetenekli yapay zeka modelimiz
Gemini aynı zamanda şimdiye kadarki en esnek modelimizdir; veri merkezlerinden mobil cihazlara kadar her şeyi verimli bir şekilde çalıştırabilir. En son teknolojiye sahip yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile oluşturma ve ölçeklendirme yöntemlerini önemli ölçüde geliştirecek.
İlk versiyonumuz olan Gemini 1.0'ı üç farklı boyut için optimize ettik:
Gemini Ultra — son derece karmaşık görevler için en büyük ve en yetenekli modelimiz.
Gemini Pro — çok çeşitli görevleri ölçeklendirmek için en iyi modelimiz.
Gemini Nano — cihaz içi görevler için en verimli modelimiz.
Son teknoloji performans
Gemini modellerimizi titizlikle test ediyoruz ve çok çeşitli görevlerdeki performanslarını değerlendiriyoruz. Gemini Ultra'nın doğal görüntü, ses ve video anlayışından matematiksel akıl yürütmeye kadar performansı, büyük dil modeli (LLM) araştırma ve geliştirmesinde kullanılan yaygın olarak kullanılan 32 akademik kriterin 30'unda mevcut en son sonuçları aşmaktadır.
Gemini Ultra, %90,0 puanla matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konunun bir kombinasyonunu kullanarak hem dünyayı hem de dünyayı test eden MMLU (büyük çoklu görev dil anlayışı) konusunda insan uzmanlarından daha iyi performans gösteren ilk modeldir. bilgi ve problem çözme yetenekleri.
MMLU'ya yönelik yeni kıyaslama yaklaşımımız, Gemini'nin zor soruları yanıtlamadan önce akıl yürütme yeteneklerini daha dikkatli kullanmasına olanak tanıyarak, yalnızca ilk izlenimi kullanmaya göre önemli gelişmelere yol açar.
Gemini, metin ve kodlama da dahil olmak üzere bir dizi kıyaslamada son teknoloji performansı geride bırakıyor.
Gemini Ultra also achieves a state-of-the-art score of 59.4% on the new MMMU benchmark, which consists of multimodal tasks spanning different domains requiring deliberate reasoning.
With the image benchmarks we tested, Gemini Ultra outperformed previous state-of-the-art models, without assistance from optical character recognition (OCR) systems that extract text from images for further processing. These benchmarks highlight Gemini’s native multimodality and indicate early signs of Gemini's more complex reasoning abilities.
See more details in our Gemini technical report.
Gemini surpasses state-of-the-art performance on a range of multimodal benchmarks.
Next-generation capabilities
Until now, the standard approach to creating multimodal models involved training separate components for different modalities and then stitching them together to roughly mimic some of this functionality. These models can sometimes be good at performing certain tasks, like describing images, but struggle with more conceptual and complex reasoning.
We designed Gemini to be natively multimodal, pre-trained from the start on different modalities. Then we fine-tuned it with additional multimodal data to further refine its effectiveness. This helps Gemini seamlessly understand and reason about all kinds of inputs from the ground up, far better than existing multimodal models — and its capabilities are state of the art in nearly every domain.
Learn more about Gemini’s capabilities and see how it works.
Sophisticated reasoning
Gemini 1.0’s sophisticated multimodal reasoning capabilities can help make sense of complex written and visual information. This makes it uniquely skilled at uncovering knowledge that can be difficult to discern amid vast amounts of data.
Its remarkable ability to extract insights from hundreds of thousands of documents through reading, filtering and understanding information will help deliver new breakthroughs at digital speeds in many fields from science to finance.
2:43
Gemini unlocks new scientific insights
Understanding text, images, audio and more
Gemini 1.0 was trained to recognize and understand text, images, audio and more at the same time, so it better understands nuanced information and can answer questions relating to complicated topics. This makes it especially good at explaining reasoning in complex subjects like math and physics.
1:59
Gemini explains reasoning in math and physics
Advanced coding
Our first version of Gemini can understand, explain and generate high-quality code in the world’s most popular programming languages, like Python, Java, C++, and Go. Its ability to work across languages and reason about complex information makes it one of the leading foundation models for coding in the world.
Gemini Ultra excels in several coding benchmarks, including HumanEval, an important industry-standard for evaluating performance on coding tasks, and Natural2Code, our internal held-out dataset, which uses author-generated sources instead of web-based information.
Gemini can also be used as the engine for more advanced coding systems. Two years ago we presented AlphaCode, the first AI code generation system to reach a competitive level of performance in programming competitions.
Using a specialized version of Gemini, we created a more advanced code generation system, AlphaCode 2, which excels at solving competitive programming problems that go beyond coding to involve complex math and theoretical computer science.
5:01
Gemini excels at coding and competitive programming
When evaluated on the same platform as the original AlphaCode, AlphaCode 2 shows massive improvements, solving nearly twice as many problems, and we estimate that it performs better than 85% of competition participants — up from nearly 50% for AlphaCode. When programmers collaborate with AlphaCode 2 by defining certain properties for the code samples to follow, it performs even better.
We’re excited for programmers to increasingly use highly capable AI models as collaborative tools that can help them reason about the problems, propose code designs and assist with implementation — so they can release apps and design better services, faster.
See more details in our AlphaCode 2 technical report.
More reliable, scalable and efficient
We trained Gemini 1.0 at scale on our AI-optimized infrastructure using Google’s in-house designed Tensor Processing Units (TPUs) v4 and v5e. And we designed it to be our most reliable and scalable model to train, and our most efficient to serve.
On TPUs, Gemini runs significantly faster than earlier, smaller and less-capable models. These custom-designed AI accelerators have been at the heart of Google's AI-powered products that serve billions of users like Search, YouTube, Gmail, Google Maps, Google Play and Android. They’ve also enabled companies around the world to train large-scale AI models cost-efficiently.
Today, we’re announcing the most powerful, efficient and scalable TPU system to date, Cloud TPU v5p, designed for training cutting-edge AI models. This next generation TPU will accelerate Gemini’s development and help developers and enterprise customers train large-scale generative AI models faster, allowing new products and capabilities to reach customers sooner.
A row of Cloud TPU v5p AI accelerator supercomputers in a Google data center.
Built with responsibility and safety at the core
At Google, we’re committed to advancing bold and responsible AI in everything we do. Building upon Google’s AI Principles and the robust safety policies across our products, we’re adding new protections to account for Gemini’s multimodal capabilities. At each stage of development, we’re considering potential risks and working to test and mitigate them.
Gemini has the most comprehensive safety evaluations of any Google AI model to date, including for bias and toxicity. We’ve conducted novel research into potential risk areas like cyber-offense, persuasion and autonomy, and have applied Google Research’s best-in-class adversarial testing techniques to help identify critical safety issues in advance of Gemini’s deployment.
To identify blindspots in our internal evaluation approach, we’re working with a diverse group of external experts and partners to stress-test our models across a range of issues.
To diagnose content safety issues during Gemini’s training phases and ensure its output follows our policies, we’re using benchmarks such as Real Toxicity Prompts, a set of 100,000 prompts with varying degrees of toxicity pulled from the web, developed by experts at the Allen Institute for AI. Further details on this work are coming soon.
To limit harm, we built dedicated safety classifiers to identify, label and sort out content involving violence or negative stereotypes, for example. Combined with robust filters, this layered approach is designed to make Gemini safer and more inclusive for everyone. Additionally, we’re continuing to address known challenges for models such as factuality, grounding, attribution and corroboration.
Responsibility and safety will always be central to the development and deployment of our models. This is a long-term commitment that requires building collaboratively, so we’re partnering with the industry and broader ecosystem on defining best practices and setting safety and security benchmarks through organizations like MLCommons, the Frontier Model Forum and its AI Safety Fund, and our Secure AI Framework (SAIF), which was designed to help mitigate security risks specific to AI systems across the public and private sectors. We’ll continue partnering with researchers, governments and civil society groups around the world as we develop Gemini.
Making Gemini available to the world
Gemini 1.0 is now rolling out across a range of products and platforms:
Gemini Pro in Google products
We’re bringing Gemini to billions of people through Google products.
Starting today, Bard will use a fine-tuned version of Gemini Pro for more advanced reasoning, planning, understanding and more. This is the biggest upgrade to Bard since it launched. It will be available in English in more than 170 countries and territories, and we plan to expand to different modalities and support new languages and locations in the near future.
We’re also bringing Gemini to Pixel. Pixel 8 Pro is the first smartphone engineered to run Gemini Nano, which is powering new features like Summarize in the Recorder app and rolling out in Smart Reply in Gboard, starting with WhatsApp, Line and KakaoTalk1 — with more messaging apps coming next year.
In the coming months, Gemini will be available in more of our products and services like Search, Ads, Chrome and Duet AI.
We’re already starting to experiment with Gemini in Search, where it's making our Search Generative Experience (SGE) faster for users, with a 40% reduction in latency in English in the U.S., alongside improvements in quality.
Building with Gemini
Starting on December 13, developers and enterprise customers can access Gemini Pro via the Gemini API in Google AI Studio or Google Cloud Vertex AI.
Google AI Studio is a free, web-based developer tool to prototype and launch apps quickly with an API key. When it's time for a fully-managed AI platform, Vertex AI allows customization of Gemini with full data control and benefits from additional Google Cloud features for enterprise security, safety, privacy and data governance and compliance.
Android developers will also be able to build with Gemini Nano, our most efficient model for on-device tasks, via AICore, a new system capability available in Android 14, starting on Pixel 8 Pro devices. Sign up for an early preview of AICore.
Gemini Ultra coming soon
For Gemini Ultra, we’re currently completing extensive trust and safety checks, including red-teaming by trusted external parties, and further refining the model using fine-tuning and reinforcement learning from human feedback (RLHF) before making it broadly available.
As part of this process, we’ll make Gemini Ultra available to select customers, developers, partners and safety and responsibility experts for early experimentation and feedback before rolling it out to developers and enterprise customers early next year.
Early next year, we’ll also launch Bard Advanced, a new, cutting-edge AI experience that gives you access to our best models and capabilities, starting with Gemini Ultra.
The Gemini era: enabling a future of innovation
This is a significant milestone in the development of AI, and the start of a new era for us at Google as we continue to rapidly innovate and responsibly advance the capabilities of our models.
Gemini'de şu ana kadar büyük ilerleme kaydettik ve planlama ve bellekteki ilerlemeler ve daha iyi yanıtlar vermek üzere daha fazla bilgi işlemek için bağlam penceresini artırmak da dahil olmak üzere gelecekteki sürümler için yeteneklerini daha da genişletmek için çok çalışıyoruz.
Yaratıcılığı artıracak, bilgiyi genişletecek, bilimi ilerletecek ve dünya çapında milyarlarca insanın yaşama ve çalışma biçimini dönüştürecek bir inovasyon geleceği olan yapay zeka tarafından sorumlu bir şekilde desteklenen bir dünyanın inanılmaz olanakları bizi heyecanlandırıyor.Van Gazetesi - Van Haber - vanhaber