今日の世界では、AIはもはや研究所やテックスタートアップだけのものではなく、ほぼすべての人の手の中にあります。『Prompting Made Simple: How to Use ChatGPT and Unlock the Power ...
HackerNewsでは、スクリーンショットとテキストの双方を送信すべき、スクリーンショットを送る側の共感と礼儀正しさが不可欠など様々な意見が集まっている。Appleのシステムに統合されたOCR機能やApple Intelligence、Google LensとGemini連携などAIを用いた近年のスクリーンショット画像の進化やWindowsのSnipping ...
Microsoftの研究者らが、ChatGPTやGoogle GeminiなどのAIチャットボットを支える大規模言語モデル(LLM)に、暗号化された通信からでも会話のトピックを推測することを可能にする脆弱(ぜいじゃく)性「Whisper Leak」を報告しています。このWhisper Leakは、テストされた28種類のLLMの多くに影響を及ぼすことが確認されました。
Metaは、1600言語以上に対応する自動音声認識「Omnilingual ASR」を発表し、GitHubで公開した。大規模SSLとLLM-ASRアプローチを採用し、リソースの少ない言語もサポート。ゼロショット学習で新言語にも拡張可能としている。