大規模言語モデル(LLM)の性能を左右する「学習データの混合比率」の決定において、従来の最適化手法にはデータプールが変更されると予測が破綻するという構造的な欠陥があった。清華大学の研究チームが2026年7月1日にarXivで発表した新論文は、この課題に対して「因果推論」を導入した新フレームワーク「CausalMix」を提案している。これにより、データプールが変動しても、高コストなプロキシモデルの再 ...