続、コーパス

 とある公開されている研究用コーパスに不備があるなあということを書いた(コーパス - 日々のメモ)。
 その後もそのコーパスについての不備を作成者に報告するかどうか、そして自分がそのコーパスを使うか使わないかということについて考えていた。たまにハードディスク上に保存したそのコーパスの声を聞いたりしていた。そして、1番目の話者の0235という文中の「なんでも」というところのラベルが「なにでも」となっていることに気づいた。軽微なミスに見えるかもしれないが、いろいろと応用の性能に差が出るくらいのものではある。
 おそらくほかの発話にも同様の不備があるのだろうと思い、報告しても直しきれないだろうと判断して、結局、不備は報告しないことにした。そして私も使わないのであった。
 音質がいいだけに、もったいないことである。

 

 ところで今私がほしい音声資料は、歌手の小田和正さんの声である。奇跡のようなあの声はどうなっているんだ。
 あと、腹話術師のいっこく堂さんの声もほしい。