Incidencia #10370

Windows 版における複合語モジュール
Abrir Fecha: 2007-05-10 11:12 Última actualización: 2007-05-10 11:12

Informador:
Propietario:
Tipo:
Estado:
Open [Owner assigned]
Componente:
(Ninguno)
Hito:
(Ninguno)
Prioridad:
5 - Medium
Gravedad:
5 - Medium
Resolución:
Ninguno
Fichero:
Ninguno

Details

Windows 版 chasen-2.4.0 + unidic-1.3.0 で「何時」を解
析すると、以下の
ような結果になります。

------------------------------------------------------
----------------
<cha:W1 orth="" kana="ナン" pron="ナン"
pos="BOS/EOS" ...></cha:W1>
<cha:W1 orth="" kana="ジ" pron="ジ"
pos="BOS/EOS" ...></cha:W1>
------------------------------------------------------
----------------

orth と pos が変です。

「何時」は複合語として以下のように登録されており、

------------------------------------------------------
----------------
(POS (名詞 普通名詞 一般)) ((LEX (何時 1730))
(COMPOUND
((POS (名詞 数詞)) (LEX 何) (READING ナン) (PRON
ナン) (INFO ...))
((POS (接尾辞 名詞的 助数詞)) (LEX 時) (READING
ジ) (PRON ジ) (INFO ...))
))
------------------------------------------------------
----------------

正しくは以下のように解析されるべきです。

------------------------------------------------------
----------------
<cha:W1 orth="何" kana="ナン" pron="ナン" pos="名詞-数
詞" ...>何</cha:W1>
<cha:W1 orth="時" kana="ジ" pron="ジ" pos="接尾辞-名詞
的-助数詞" ...>時</cha:W1>
------------------------------------------------------
----------------

実際、同じソースから作られているはずの Unix 版 (gcc-
3.4.4 で make) で
は、正しく解析されます。

Unix 版で作成したシステム辞書を使っても同じ現象が生じ
るので、mkchadic
ではなく、chasen の問題です。

o Windows 版を作成したときの版が古かった。
o Windows 用に書かれたコード部分にバグがある。
o ソースコードにもともと潜在的な問題があり、Windows
版で使っているコ
ンパイラ (borland かなにかに変えたと言ってましたよ
ね) でそれが顕在
化した。

あたりだと思うのですが、心当たりはあるでしょうか。

Ticket History (0/0 Histories)

Attachment File List

No attachments

Editar

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Entrar