motogp fan

motogp ファンによる、モトgp 結果、モトgp日程を報告するブログ、ガジェットネタも

リザルトを加工しよう!PDFから変換 motogp結果を円滑に更新するプロジェクト

MotoGPの結果表は、紙で配布するのが目的と思われ、A4サイズにベストなレイアウトでPDF化されます。
この仕組みは凄くて、イベント終了後、集計、PDFファイル作成が数分で完了、ホームページに公開されます。

とは言え、ブログで使うにはちょっと見ずらい。
使いやすいようにデータ化します。

Acrobatでエクセル化

有償版のAcrobatで、pdfファイルをエクセルに変換してみました。

f:id:motagp:20150804081301j:plain

 

おしい、ヘッダーが壊れる。
それ以外は良さそう。
手作業でヘッダー作れば利用できます。

 

コピー&ペーストでテキスト化

エクセル化するには有料Acrobatが必要なので、Acrobat readerで対応できる方法考えます。
いろんなソフトで活用する為に、CSVファイル変換を試みます。

先ずはAcrobat readerで開き、空のテキストファイルにコピペ。

f:id:motagp:20150804081302j:plain

 

壊れたヘッダーや不要な行を削除

ヘッダーは後で作成する事にして、余計な情報は削除します。

f:id:motagp:20150804081259j:plain

 

カンマ区切りに置換してCSV

空白をカンマに置換

f:id:motagp:20150804081258j:plain

 

ヘッダーを先頭行に追加

何番目の列が何か分かるようにヘッダーを作成。

f:id:motagp:20150804081257j:plain

 

余計なカンマを排除

空白の一括置換でカンマを付けたら、チーム名が分断されてました。
仕方ないのでチーム毎に置換「Repsol Honda Team」→「Repsol Honda Team

f:id:motagp:20150804081255j:plain

3チームほど置換して、めんどい、毎回この作業は出来ないと気が付く。

自動化を考えましょう。

そんな訳で、次回に続く。