Pythonで英文をTransformer(BERT)で翻訳してみる

Pythonで英文をTransformer(BERT)での翻訳を実施します.

今回はGoogle ColabとGoogle Driveを連携させて,notebook形式で実行してます.

Google Colaboratory(以下Google Colab)は、Google社が無料で提供している機械学習の教育や研究用の開発環境です。開発環境はJupyter Notebookに似たインターフェースを持ち、Pythonの主要なライブラリがプリインストールされています。
引用元:Google Colabの使い方 (opens new window)

全国630店舗以上!もみほぐし・足つぼ・ハンドリフレ・クイックヘッドのリラクゼーション店【りらくる】

# モジュールのインストール

下記のコマンドでモジュールをインストールします.

!pip install -U easynmt

# 翻訳実行

日本語の翻訳ができるモデルがmbart50_m2mしか実行できなかったので,下記のコードで実行します.

# モデルの読み込み

下記のコードでモデルの読み込みを実施します.

from easynmt import EasyNMT
model = EasyNMT('mbart50_m2m')

# 翻訳可能な言語の確認

下記のコマンドで翻訳可能な言語の確認します.

# 英文から翻訳可能な言語の確認
print("All languages with source_lang=en. I.e., we can translate English (en) to these languages.")
print(model.get_languages(source_lang='en'))

# 翻訳実行

下記のコマンドで翻訳を実行します.

# いくつかの言語を日本語に訳します
sentences = ['Dies ist ein Satz in Deutsch.',   # ドイツ語
             '这是一个中文句子',    #中国語
             'これは日本語の文です.',     #日本語
             'This is a english sentence',    #英語
             'Esta es una oración en español.']     #スペイン語
print(model.translate(sentences, target_lang='ja'))

# 出力
# ['これがドイツ語の句です。', 'それは中国語の句です', 'これは日本語の文です.', 'これは英語の文です', 'これが、スペイン語の言葉です。']

# まとめ

Pythonで英文をTransformer(BERT)での翻訳を実施しました.

次はPDFの翻訳と組み合わしたいと考えています.

# 参考サイト

UKPLab/EasyNMT (opens new window)

全国630店舗以上!もみほぐし・足つぼ・ハンドリフレ・クイックヘッドのリラクゼーション店【りらくる】

matplotlibで日本語表示を実施する

matplotlibで日本語表示を実施する

matplotlibでキャッシュの削除を行わずに日本語表示を実施します.

Pythonで英文のPDFをレイアウトを維持したまま翻訳してみる

Pythonで英文のPDFをレイアウトを維持したまま翻訳してみる

Pythonで英文のPDFをレイアウトを維持したままの翻訳を実装します.