プロジェクト‐ノート:索引/読みがなの記載法
読みがなの記載法
編集基本線は記事の冒頭を「'''記事名'''(きじめい)は~」とするのが筋だと思いますが、
- 記事名が仮名のみでできている場合
- 記事名がローマ字の場合
- 人物記事(日本人と日本人以外でそれぞれ検討)
をどうするか、それぞれ検討が必要だと思います。とりあえず問題提起です。--Tamago915 2005年10月30日 (日) 01:43 (UTC)
- 何らかのカテゴリを指定している記事の場合、読みがながカテゴリへのリンクに含まれているので、最優先でカテゴリ内の読みがなを得るようにすればよいのではないでしょうか。--Tamago915 2005年10月30日 (日) 12:46 (UTC)
- ソートキーは必ずしも読み仮名ではない(鉄道駅・道路など)ので難しいのではないでしょうか。
- 「あ」と書いて「ん」と読ませるようなことは滅多にないので項目名でソートすれば問題ないように思います。
- アルファベットでソートでしょうか。MS-DOSは読み仮名を拾って"エムエスドス"でも並べるようにできればよいと思います。
- 日本人は姓名でそのまま並べればよいと思いますが、欧米人の場合は名姓・姓名の両方で引けると親切ですね。--Brevam 2005年11月2日 (水) 06:21 (UTC)
- ソートキーは必ずしも読み仮名ではない(鉄道駅・道路など)ので難しいのではないでしょうか。
- カテゴリの読みを使うことが技術的に可能かどうか検討をお願いします。可能であれば、カテゴリのキーのうち最も長いものを読みがなに使えるのではないかと思います。それでだめなものは手作業でデータを書き換えることでどうでしょうか(手作業での書き換えが可能かどうかも検討が必要ですが)。
カテゴリを用いるのは可能?
編集カテゴリを用いて、[[Category:索引|よみがな]]を全記事につけて、これをボットで吸い出すというのはありでしょうか。15万記事を全部改修する必要はありますが。--Tamago915 2005年10月30日 (日) 02:00 (UTC)
こんにちは。カテゴリを使う方法、私も考えていましたが。 例えば、頭2文字をキーとして、[[Category:索引 あさ|ひしんふん]]とすれば、きれいに並ぶと思います。当然、上位カテゴリとして[[Category:索引 あ]]を準備したり、下位カテゴリとして頭3文字以上のカテゴリも使用可能で、現在の索引に合わせることも、将来組み替えることも可能でしょう。将来の増加を考えると、頭3文字をデフォルトとするくらいがよいのかもしれません。
私の考える最大の問題が、リダイレクトの項目です
リダイレクトではカテゴリが利かないように思います。下でBrevamさんが無視されると書いていますが、その通り無視されてカテゴリとして利かないか、逆にカテゴリが利いてリダイレクトが利かないか、どちらかではなかったでしょうか。最近仕様が変わった(あるいは変わる)ということがあるかもしれませんが。 --Yas 2005年11月3日 (木) 07:33 (UTC)
- サンドボックスで試してみました。上記は誤りでした。 --Yas 2005年11月3日 (木) 08:04 (UTC)
- カテゴリを使うといっても、「索引」カテゴリに読みがなを登録しておき、索引を生成するときにカテゴリキーを取り出すことを考えており、索引カテゴリそのものが索引の代用になるとは考えていませんでした。2文字のところを3文字に分割するのが厄介だと思っていたのがその理由ですが、考えてみればこれこそ機械的に自動化できる作業ですね。最初は頭2文字にしておいて、記事数が一定の値(1000項目とか)を超えたら一番多い項目を分割する、などのルールでよいかもしれません。--Tamago915 2005年11月3日 (木) 07:56 (UTC)
この方針でいけるかどうかはわからないのですが、「読みがなを自動抽出して索引カテゴリを記事に貼り付ける Bot」と、「索引カテゴリから索引を生成する Bot」とに分ければよいのではないでしょうか。前者の Bot は、
- 索引カテゴリが張られていない記事を探す。
- 記事の先頭から読みがなを抽出する。第1行に括弧に囲まれた部分があればそれを読みがなとし、なければ先頭から最初に漢字が現れる部分までを読みがなとする。(かなり適当です)
- 抽出した読みがなをインデックス生成に適した形に変換(濁点・半濁点を取り除く、小文字を大文字に変える)する。
- 索引カテゴリを記事の末尾に挿入する。
後者の Bot は、
- すべての記事の索引カテゴリと関連する情報(リダイレクト先など)を抽出する。
- 辞書順にソートし、整形する。
- 索引ページとして出力する。
という流れで動くことを想定しています。前者は適時、後者は時間がかかる作業になるでしょうから月1回程度実行すればよいだろうと考えています。--Tamago915 2005年11月12日 (土) 14:37 (UTC)
リダイレクト記事の読みがな
編集どうやって読みがなを付けましょうか? いい案が思いつかないのですが……。--Tamago915 2005年10月30日 (日) 03:36 (UTC)
#redirect[[ほげ]](よみがな) #redirect[[ほげ]] [[Category:索引|よみがな]]
リダイレクトの後ろの異物は無視されるので、そのまま書いてしまえば大丈夫です。--Brevam 2005年11月2日 (水) 06:21 (UTC)
サンドボックスでやってみました。確かにできるようです。 --Yas 2005年11月3日 (木) 08:04 (UTC)