2008.01.08 Excelでの索引作業 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
少しずつ続けてきた作業がようやく昨日に終了。最後は風邪の中でも、集中して作業をしていたら、いつの間にか昼になっていました。で、その前の作業で、データの確認に時間を取りました。その記録。 書名と著者名のデータベースを作ると、どうしても重複やら、名前の間違いなどが生じます。そこで、名前でソートして、確認しますが、関数でまず次の通り。Aに書名、Bに著者名、Cに出版、Dにシリーズ・備考、Eに刊年とします。
そこで、Gにも次の数式を入れます。
Hに合計を入れます。
これで、集計して、オーフィルターで、0よりも大きいのを表示すればいいわけです。あとは、目視確認。 次に、AとBをソートして確認。この場合、ふりがなをOnにするとよいでしょう。ここで気にするのは、似たような文字です。「蓑」と「簑」、「己」と「巳」の違いなど区別かつかないものがあります。これをよく確認します。「澤」が「擇」になっていたことあって、ここは慎重に扱います。 そして複合ソートです。出版と著者でソートします。そこで重複を確認します。 索引作成は、著者を分解することから始まります。「,」などの区切りがあったらそこで、分解するようにします。デリミタで切っても良いでしょう。私は、テキストファイルにB列をコピーして、エディタで、カンマをタブに変換して、Jにコピーしました。そうすれば、タブがセルを複数に分けます。あとはその横に列を挿入して、年と月を入れるだけです。
これに工夫をします。まず、Fに
このうち、FGHをコピーし、同じ所に形式を選んで、値だけを貼り付けます。そして、ABCを列削除します。
これをエディタにコピーします。あとは、正規表現で、 索引のヒントは、ふりがなをつけるとソートをしやすくなります。その場合、索引のふりがなは清音だけとして、濁音や半濁音は変換します。たとえば、「山田良子」だったら、「やまたりようこ」です。これでソートは一度で終わります。 私がした方法は、年を98などの半角数字、月を丸数字にしました。そして、組み版ソフトで、禁則処理の行頭と行末に半角数字を指定すると、年と月が分割されることなく、表示できます。 この作業による実物はどうなったかは、いずれ。ただ、7292件のデータから、著者名で索引を作り、3094項目にまとめました。結局、288ページに。16面付けだったので、16×18でこのページ数に。フォントはJIS2004を使用しました。合成フォントで仮名は少し小さく。欧文は読みやすいものに。そして後は、使用したデータの許諾を得て、微調整をして終了です。 次は、組み版ソフトで縦組みの文章の作業があります。この作業の記録はいずれ。 [今日の記録] |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Copyright 黒川孝広 © 1997-2008,Kurokawa Takahiro All rights reserved. | |||||