警告
当社の現在の開発努力の大部分は mini-swe-agent に注力しており、 これが SWE-agent に取って代わりました。これは SWE-agent と同等のパフォーマンスを実現しながら、 はるかにシンプルです。 相違点についての詳細は FAQ を参照してください。 当社の一般的な推奨事項は、今後は SWE-agent ではなく mini-SWE-agent を使用することです。
SWE-agent により、選択した言語モデル(GPT-4o や Claude Sonnet 4 など)が自律的にツールを使用して、 実際の GitHub リポジトリの問題を修正したり、 サイバーセキュリティの脆弱性を発見したり、 カスタムタスクを実行できるようになります。
- ✅ SWE-bench でオープンソースプロジェクト中で最先端
- ✅ 自由度が高く & 汎用的:言語モデルに最大限の自律性を与えます
- ✅ カスタマイズ可能 & 完全にドキュメント化:単一の
yamlファイルで管理されます - ✅ 研究向けに設計:シンプルで改造しやすい設計
SWE-agent はプリンストン大学とスタンフォード大学の研究者により構築・保守されています。
- 7月24日:Mini-SWE-Agent は SWE-bench で Python 100 行で 65% を達成しました!
- 5月2日:SWE-agent-LM-32b は SWE-bench でオープンウェイト最先端を達成
- 2月28日:SWE-agent 1.0 + Claude 3.7 は SWE-Bench 完全版で最先端
- 2月25日:SWE-agent 1.0 + Claude 3.7 は SWE-bench 検証版で最先端
- 2月13日:SWE-agent 1.0 をリリース:SWE-bench ライト版で最先端 & 多数の新機能
- 12月7日:SWE-agent & SWE-bench チームへのインタビュー
👉 ブラウザで SWE-agent を試してみてください: (詳細情報)
詳しく学ぶには、当社の ドキュメント をご覧ください:
SWE-agent: EnIGMA は攻撃的なサイバーセキュリティ(キャプチャ・ザ・フラッグ)チャレンジを解くためのモードです。 EnIGMA は複数のサイバーセキュリティベンチマークで最先端の結果を達成しています(リーダーボードを参照)。 EnIGMA を 1.0 に向けて更新している間、SWE-agent 0.7 をご使用ください。
さらに、他のプロジェクトにもご興味があるかもしれません:
コードベースへの貢献をご希望の場合は、issue および pull request をお待ちしています!大規模なコード変更については、まず issue で議論することをお勧めします。
SWE-agent はプリンストン大学で John Yang*、Carlos E. Jimenez*、Alexander Wettig、Kilian Lieret、Shunyu Yao、Karthik Narasimhan、Ofir Press により開始されたアカデミックプロジェクトです。 担当者:John Yang、Carlos E. Jimenez、Kilian Lieret(メール:johnby@stanford.edu、carlosej@cs.princeton.edu、kl5675@princeton.edu)。
このワークをお役に立つと感じていただけた場合は、以下を使用して引用することをご検討ください:
SWE-agent の引用
@inproceedings{yang2024sweagent,
title={{SWE}-agent: Agent-Computer Interfaces Enable Automated Software Engineering},
author={John Yang and Carlos E Jimenez and Alexander Wettig and Kilian Lieret and Shunyu Yao and Karthik R Narasimhan and Ofir Press},
booktitle={The Thirty-eighth Annual Conference on Neural Information Processing Systems},
year={2024},
url={https://arxiv.org/abs/2405.15793}
}SWE-agent のサマライザー、インタラクティブコマンド、または攻撃的なサイバーセキュリティ機能を使用した場合は、以下の引用も合わせてご検討ください:
EnIGMA の引用
@misc{abramovich2024enigmaenhancedinteractivegenerative,
title={EnIGMA: Enhanced Interactive Generative Model Agent for CTF Challenges},
author={Talor Abramovich and Meet Udeshi and Minghao Shao and Kilian Lieret and Haoran Xi and Kimberly Milner and Sofija Jancheska and John Yang and Carlos E. Jimenez and Farshad Khorrami and Prashanth Krishnamurthy and Brendan Dolan-Gavitt and Muhammad Shafique and Karthik Narasimhan and Ramesh Karri and Ofir Press},
year={2024},
eprint={2409.16165},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2409.16165},
}MIT です。LICENSE を確認してください。