-
Notifications
You must be signed in to change notification settings - Fork 15
Open
Labels
Description
概要
Japanese Mozilla community group の Slack に参加して日本語訳作業を着手するにあたって、翻訳すべきページの候補を探し出す作業自体が容易ではないため、「翻訳されたページ一覧」「翻訳されていないページ一覧」「翻訳が不十分なページ一覧」などをリストアップして一覧表を提供したい。
方針
content リポジトリに存在するページが、翻訳されて translated-content リポジトリに存在するという仮定に基づいて、「content リポジトリの en-us ディレクトリ下のファイルリストに対する、translated-content リポジトリの ja ディレクトリ下のファイルの存在」を一覧化する。
その上で、存在する日本語版ファイルの翻訳状況(未翻訳の英文が残っていないか、訳がおかしい部分が残っていないかなど)を何らかの方法で検出して一覧表に「翻訳状況」として明示化したい。
これにより、「日本語訳ページが存在しないページ」だけでなく「日本語訳ページが存在するものの、翻訳が不十分で修正する必要があるページ」を検出することができる。
課題
- 「日本語訳ページが存在しないページ」の検出
- リポジトリのファイルを検索すれば導出可能(対応済み)
- 「日本語訳ページが存在するものの、翻訳が不十分で修正する必要があるページ」の検出
- ある日本語訳ページに対して、その翻訳状況を評価するアルゴリズムが見つけられていない。
- 英語版ページに対して内容が(英語版ページが更新されているなどして)異なっている(不足している)ページの検出
- 意図的に日本語訳ページに(英語版にはない)独自の説明を追加しているものは除く
- 日本語訳ページが存在するが、未翻訳の段落が残っているページの検出
- 誤訳、誤字・脱字・衍字があるページの検出
- 英語版ページに対して内容が(英語版ページが更新されているなどして)異なっている(不足している)ページの検出
- ある日本語訳ページに対して、その翻訳状況を評価するアルゴリズムが見つけられていない。
参考
制作物
- MDN翻訳ステータス一覧表 https://mdn.lavoscore.org/
- lavoscore.org は私(debiru)の管理する個人サイトのドメイン名です。
- 2022年3月時点では、「日本語訳ページが存在しないページ」の検出しか実現できていません。
miminari, yoshinorin, windchime-yk and unarist