GoogleがGemini 3 Flashの新機能として高精度な画像理解機能「Agentic Vision」を発表しました。Agentic Visionでは画像の拡大などを行いつつ能動的な画像理解が可能で、「Pythonで境界ボックスを描画して数を正確に数える」といったコード実行も駆使する機能も搭載しています。
Googleは27日、Gemini 3 Flashの新機能「Agentic ...
米Googleは1月27日(現地時間)、「Gemini 3 Flash」の新しい視覚機能「Agentic Vision」を発表した。従来からある「Gemini Vision」が単に画像を読み取り、その場で一回きりの応答を行っていたのに対し、「Agentic Vision」は考える(Think)、実行する(Act)、観察する ...
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする