自動運転に関連する論文の要約をしています。 本研究では、Webスケールデータで訓練された視覚言語モデル(VLM)がエンドツーエンドの自動運転システムにどのように統合できるかを探求する。提案するタスクであるグラフVQA(質問応答)は、物体の位置 ...