Our paper has been published at The 7th IEEE International Workshop on Empirical Software Engineering in Practice (IWESEP2016)!!

title = {Clustering {OSS} License Statements Toward Automatic Generation of License Rules},
author = {Yunosuke Higashi and Yuki Manabe and Masao Ohira},
booktitle = {Proceedings of the 7th IEEE International Workshop on Empirical Software Engineering in Practice (IWESEP2016)},
month = {3},
year = {2016},


情報処理学会 山下記念研究賞受賞!






         title = {オープンソースソフトウェア工学},
        author = {伊原 彰紀 and 大平 雅雄},
       journal = {コンピュータソフトウェア},
        volume = {33},
        number = {1},
         pages = {28--40},
         month = {1},
          year = {2016},


独立行政法人情報処理推進機構 (IPA) 技術本部 ソフトウェア高信頼化センター主催セミナー「定量的なプロジェクト管理・プログラム管理のススメ ~見える化による生産性・信頼性の向上~」において行われた大平准教授の講演「開発データマイニングのススメ:「見える化」の次のステップ」の資料が公開されました.


情報処理学会ソフトウェア工学研究会主催のソフトウェアエンジニアリングシンポジウム2015 (SES2015) にて, 以下3件の研究発表を行いました!

  • テスト履歴に基づくFault-proneモジュール予測に向けた検討(吉行勇人,大平雅雄)
  • データサイズを考慮したコミッター候補者予測モデルの検討(松本明,伊原彰紀,大平雅雄)
  • ユースケースの多面的評価によるソフトウェアモジュールの価値計測(森崎修司,髙口鉄平,永瀬美穂,大平雅雄)


組込み総合技術展関西 (ETWest2015) IPA/SECブースプレゼン

組込み総合技術展 関西 (ETWest2015)にて行われたIPA/SECブースプレゼンにて行われた大平准教授による技術紹介の資料が公開されました.

  • プロジェクト管理ツールEPM-Xの機能拡張によるプロアクティブ型プロジェクトモニタリング環境の構築 ~次世代の定量的プロジェクト管理ツールとリポジトリマイニング研究基盤~

ソフトウェア・シンポジウム2015 in 和歌山

ソフトウェア技術者協会主催のソフトウェア・シンポジウム2015 in 和歌山にて,『Blocking Bugの発生原因を理解するための依存関係分析(金城 清史, 山谷 陽亮, 松本 明, 大平 雅雄)』および,『ソフトウェア開発状況の把握を目的とした変化点検出を用いたソフトウェアメトリクスの時系列データ分析(久木田 雄亮, 柏 祐太郎, 大平 雅雄)』,『機械学習を用いたテキスト分類によるライセンス特定のためのルール作成プロセス支援(東 裕之輔, 眞鍋 雄貴, 大平 雅雄)』に関する研究発表を行いました!

MSR2015 data showcase paper!

Our MSR2015 (data showcase) paper has been published!! This work was conducted in collaboration with a research group of Nara Institute of Science and Technology, Japan. The dataset is downloadable from this page.

title = {A Dataset of High Impact Bugs: Manually-Classified Issue Reports},
author = {Masao Ohira and Yutaro Kashiwa and Yosuke Yamatani and Hayato Yoshiyuki and Yoshiya Maeda and Nachai Limsettho and Keisuke Fujino and Hideaki Hata and Akinori Ihara and Kenichi Matsumoto},
booktitle = {Proceedings of 12th Working Conference on Mining Software Repositories (MSR2015)},
pages = {518--521},
month = {5},
year = {2015},


情報処理学会ソフトウェア工学研究会主催の第187回ソフトウェア工学研究発表会にて, 『開発者の担当可能なタスク量を考慮したバグトリアージ手法の提案(柏 祐太郎, 大平 雅雄)』,および,『適切な優先度設定のための修正作業の分析(吉行 勇人,大平 雅雄)』に関する研究発表をおこないました!


High Impact Bug Dataset

Background and Motivation

Since increasing complexity and scale of modern software products imposes tight scheduling and resource allocations on software development projects, a project manager must carefully triage bugs to determine which bug should be necessarily fixed before shipping. Although in the field of Mining Software Repositories (MSR) there are many promising approaches to predicting, localizing, and triaging bugs, most of them do not consider impacts of each bug on users and developers but rather treat all bugs with equal weighting, excepting a few studies on high impact bugs including security, performance, blocking, and so forth. To make MSR techniques more actionable and effective in practice, we need deeper understandings of high impact bugs. In order to more precisely capture characteristics and consequences of high impact bugs, we collected 4,000 issue reports from four open source projects and tagged six types of high impact bugs on the collected issues by reviewing them manually.


You can download our dataset of high impact bags collected from the Apache Ambari, Camel, Derby, and Wicket projects. The dataset includes not only the information of issue reports but also the information of labels of high impact bugs: surprise, dormant, blocking, performance, security, and breakage bugs.

  • dataset (2.3MB, all data are included in MS-Excel FORMAT)

  • ambari (0.7MB, ambari project’s data in csv FORMAT)

  • camel (1.8MB, camel project’s data in csv FORMAT)

  • derby (1.8MB, derby PROJECT’S DATA IN CSV FORMAT)

  • wicket (1.4MB, wicket project’s data IN csv FORMAT)


Wakayama University, Japan

  • Yutaro Kashiwa (graduate student)
  • Yosuke Yamatani (graduate student)
  • Hayato Yoshiyuki (graduate student)
  • Yoshiya Maeda (graduate student)
  • Masao Ohira (associate professor)

Nara Institute of Science and Technology, Japan

  • Nachai Limsettho (graduate student)
  • Keisuke Fujino (graduate student)
  • Hideaki Hata (assistant professor)
  • Akinori Ihara (assistant professor)
  • Kenichi Matsumoto (professor)

Related publications:

  • Masao Ohira, Yutaro Kashiwa, Yosuke Yamatani, Hayato Yoshiyuki, Yoshiya Maeda, Nachai Limsettho, Keisuke Fujino, Hideaki Hata, Akinori Ihara and Kenichi Matsumoto, “A Dataset of High Impact Bugs: Manually-Classified Issue Reports”, In Proceedings, of The 12th Working Conference on Mining Software Repositories, 2015. (To appear) [Poster]
  • Yutaro Kashiwa, Hayato Yoshiyuki, Yusuke Kukita, and Masao Ohira, “A Pilot Study of Diversity in High Impact Bugs,” In Proceedings of 30th International Conference on Software Maintenance and Evolution (ICSME2014), pages 536–540, 2014.


Feel free to contact us If you find any problems with our dataset.