memo

diary201612

CSVY...CSVデータとYAML front matter

一般的な会社でもCSV形式のデータを扱う事があったりするかもしれない。おそらく、エクセルを使用して、読み込んだり、編集したりするのではないかなと思うが。(エクセルがなく、簡易的な編集だけ行う場合は、エディタでも十分可能。一般の人に言ってもピンとくる人は少ないかもしれない...)ちなみに、自分の場合は、タブ区切りのTSVが好みだ。

そのCSV形式のデータは、あくまでデータの塊のようなものであって、それが何を意味しているものなのかは、はっきり分からないかもしれない。一行目に項目のデータが入っている場合はなんとなく推測は可能だが、まあはっきりとした事は分からない。CSVデータは汎用的でよく使用されるけども、上記のような不備を抱えているフォーマットと言える。

それを解消するために、YAMLというフォーマットを利用して、ヘッダを記述すればいいというのがCSVYの考え方で、ここ最近、Markdownファイルにも使用されていたりする。YAML front matterと呼ばれたりするが、人間にも可読でき、仕様そのものも難解ではない。

ヘッダ情報があると何がよいか?データが何を意味しているのか分かりやすかったり、検索性も高まり、複数のファイルを関連付ける事もできそうで、CSVデータの扱いに幅が広がる感じですね。このCSVYの話題は検索しても日本語圏でヒットしてこないね...。世間的にはあまり興味がないのかも?


2016-12-11 21:42 tags:CSVYYAMLMarkdownYAML frontmatter