次に作りたいWebサイト

beatmania IIDX の譜面を検索できるサイト。ノーツのパターンを指定すると、そのパターンが含まれる楽曲および難易度を返すような仕組みを作りたい。1Pの2+3などの押しにくい同時押しや、1-3-1-3-1-3 のようなトリルなどが、速度が遅い順や頻度順で検索結果一覧に表示されたりすると、段階を踏んだ適切な練習ができたりするんじゃないかなあ、などと妄想しつつ。

やるべきこと

  1. textage.cc の譜面データHTMLをスクレイピング
  2. 入手した譜面データHTMLのJavaScriptを解析して、譜面データを入手
  3. 譜面データを 2-gram ~ 8-gram 程度に細切れにして、譜面部分情報とする
  4. 譜面部分情報をデータベースに格納
  5. データベースに格納した譜面部分情報を検索する仕組みを作る
  6. 検索する仕組みを呼び出すWebインターフェースを作る

いろいろな懸案事項

  • スクレイピングほんとにできるのか
  • JavaScript記述部分の構文解析の実装実現性
  • チャージノートを含む譜面部分情報の持たせかた
  • データベースの構造や検索スピード