米メディア「Futurism」が 報じた 最新研究によれば、科学者たちはMRIで取得した脳活動データから、被験者が見ている映像内容を文章として再構成する「 マインドキャプショニング 」と呼ばれる技術を開発したようです。
― Whisperの後継モデルで音声認識の精度と速度を向上 ― ...
Metaは、1600言語以上に対応する自動音声認識「Omnilingual ASR」を発表し、GitHubで公開した。大規模SSLとLLM-ASRアプローチを採用し、リソースの少ない言語もサポート。ゼロショット学習で新言語にも拡張可能としている。
※2:CTIサービスとは Computer Telephony Integrationの略。電話やFAXとコンピューターシステムを統合し、電話応対業務を高度化するシステムです。主にコンタクトセンター業務で活用され、顧客データベースと電話を連携させることで、顧客情報に基づいた的確なサポートを提供します。
■ 法人向けChatGPTサービス「ChatSense(チャットセンス)」とは ...
- AI通訳エンジンを支える共通API基盤を構築、マルチクラウド環境でエンタープライズセキュリティを実現 - Kong株式会社(本社:東京都港区、代表取締役社長:有泉 大樹、以下 Kong)は、ポケトーク株式会社(本社:東京都中央区、取締役代表執行役社長兼CEO 松田憲幸、以下 ポケトーク)が、同社が開発中の新たなAI通訳プラットフォームの共通API基盤としてKongのAPI管理プラットフォームを ...