7134 【新卒_インターンシップ】VLA(Vision-Language Action models)のロバスト性、効率性、スケーラビリティ、および失敗回復に関する研究開発

業務内容

この研究テーマでは、Vision-Language Action models (VLAs) の実用的な応用を推進するための多角的なアプローチを追求します。具体的には、以下の主要な課題に取り組みます。
(1) ロバスト性評価と改善: VLAの言語、視覚、物体認識におけるロバスト性を定量的に評価する手法を確立し、既存VLAの性能を詳細に分析します。この分析に基づき、様々な環境変化やノイズに対するVLAの耐性を向上させる新たな手法を開発します。
(2) 効率的な学習手法の検討: 人間の労力を最小限に抑えつつ、VLAを特定のタスクに効率的に適応させるための学習手法を探究します。これには、効果的なサンプル探索や合成データ生成技術の活用が含まれます。
(3)VLAのスケールアップに関する研究開発: 小規模なVLAの能力を向上させ、より大規模なタスクへの適用を可能にするための研究を実施します。データ取得戦略、追加学習メカニズム、およびモデルアーキテクチャの観点から、VLAのスケーラビリティを向上させる手法を検討し、その適用範囲を拡大します。
(4)Failure Recoveryに基づくVLAの深化: VLAの失敗表現学習と回復戦略の最適化に焦点を当て、故障や予期せぬ状況に対するVLAの頑健性を強化します。この研究を通じて、実社会におけるPhysical AIの信頼性と安全性の向上を目指します。
これらの研究を通じて、VLAがより信頼性が高く、効率的で、幅広いシナリオで機能するようになることを目指します。

募集会社

富士通株式会社

実施本部・組織

富士通研究所 フィジカルAI研究所 ブレインインテリジェンス Group

職種

研究

分野

全業種

キーテクノロジー

AI、その他

勤務地

神奈川県

勤務形態

ハイブリッド(オンライン&対面)

想定勤務期間

【3か月コース】2026年9月1日(火)~2026年11月27日(金)

想定勤務頻度

週3日 フルタイム(7時間45分)程度/日

必須スキル

プログラミング経験 Lv.3:参考書やインターネットで調べながら、自身で実装を進められる

あれば望ましいスキル

英語コミュニケーションスキル

インターンで身につくスキル
  • ・AI / Physical AIに関する最先端の研究開発の知見と方法論
  • ・ロボット実機を扱った研究開発の経験
  • ・コミュニケーションスキル
  • ・コーディングスキル