Skip to content

MDN日本語訳の翻訳ステータスを確認する一覧表を作る #593

@debiru

Description

@debiru

概要

Japanese Mozilla community group の Slack に参加して日本語訳作業を着手するにあたって、翻訳すべきページの候補を探し出す作業自体が容易ではないため、「翻訳されたページ一覧」「翻訳されていないページ一覧」「翻訳が不十分なページ一覧」などをリストアップして一覧表を提供したい。

方針

content リポジトリに存在するページが、翻訳されて translated-content リポジトリに存在するという仮定に基づいて、「content リポジトリの en-us ディレクトリ下のファイルリストに対する、translated-content リポジトリの ja ディレクトリ下のファイルの存在」を一覧化する。

その上で、存在する日本語版ファイルの翻訳状況(未翻訳の英文が残っていないか、訳がおかしい部分が残っていないかなど)を何らかの方法で検出して一覧表に「翻訳状況」として明示化したい。

これにより、「日本語訳ページが存在しないページ」だけでなく「日本語訳ページが存在するものの、翻訳が不十分で修正する必要があるページ」を検出することができる。

課題

  • 「日本語訳ページが存在しないページ」の検出
    • リポジトリのファイルを検索すれば導出可能(対応済み)
  • 「日本語訳ページが存在するものの、翻訳が不十分で修正する必要があるページ」の検出
    • ある日本語訳ページに対して、その翻訳状況を評価するアルゴリズムが見つけられていない。
      • 英語版ページに対して内容が(英語版ページが更新されているなどして)異なっている(不足している)ページの検出
        • 意図的に日本語訳ページに(英語版にはない)独自の説明を追加しているものは除く
      • 日本語訳ページが存在するが、未翻訳の段落が残っているページの検出
      • 誤訳、誤字・脱字・衍字があるページの検出

参考

制作物

  • MDN翻訳ステータス一覧表 https://mdn.lavoscore.org/
    • lavoscore.org は私(debiru)の管理する個人サイトのドメイン名です。
  • 2022年3月時点では、「日本語訳ページが存在しないページ」の検出しか実現できていません。

Metadata

Metadata

Assignees

Labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions