Pythonで英文をTransformer(BERT)で翻訳してみる
/
Pythonで英文をTransformer(BERT)での翻訳を実施します.
今回はGoogle ColabとGoogle Driveを連携させて,notebook形式で実行してます.
Google Colaboratory(以下Google Colab)は、Google社が無料で提供している機械学習の教育や研究用の開発環境です。開発環境はJupyter Notebookに似たインターフェースを持ち、Pythonの主要なライブラリがプリインストールされています。
引用元:Google Colabの使い方 (opens new window)
全国630店舗以上!もみほぐし・足つぼ・ハンドリフレ・クイックヘッドのリラクゼーション店【りらくる】
# モジュールのインストール
下記のコマンドでモジュールをインストールします.
!pip install -U easynmt
# 翻訳実行
日本語の翻訳ができるモデルがmbart50_m2m
しか実行できなかったので,下記のコードで実行します.
# モデルの読み込み
下記のコードでモデルの読み込みを実施します.
from easynmt import EasyNMT
model = EasyNMT('mbart50_m2m')
# 翻訳可能な言語の確認
下記のコマンドで翻訳可能な言語の確認します.
# 英文から翻訳可能な言語の確認
print("All languages with source_lang=en. I.e., we can translate English (en) to these languages.")
print(model.get_languages(source_lang='en'))
# 翻訳実行
下記のコマンドで翻訳を実行します.
# いくつかの言語を日本語に訳します
sentences = ['Dies ist ein Satz in Deutsch.', # ドイツ語
'这是一个中文句子', #中国語
'これは日本語の文です.', #日本語
'This is a english sentence', #英語
'Esta es una oración en español.'] #スペイン語
print(model.translate(sentences, target_lang='ja'))
# 出力
# ['これがドイツ語の句です。', 'それは中国語の句です', 'これは日本語の文です.', 'これは英語の文です', 'これが、スペイン語の言葉です。']
# まとめ
Pythonで英文をTransformer(BERT)での翻訳を実施しました.
次はPDFの翻訳と組み合わしたいと考えています.