2 机器翻?
f-denshi.com  最終更新日:16/12/13 [目次へ]

1.中国特許の機械翻訳

今回は機械翻訳[机器翻?]の現状についてのお話です。特許庁の以下のページ,

中韓文献 翻訳・検索システム

から中国の特許文献を検索してダウンロードすることができます。このページの上部の囲みの中にある,

公報テキスト検索

公報番号索引照会

の二つからは特許全文の内容を調べることができます。その下の

中国特許和文抄録テキスト検索(J-PlatPat)

中国特許和文抄録番号照会(J-PlatPat)

の二つは特許の和文抄録を調べ出して読むことができます。

この2タイプの違いは前者が特許全文後者は和文抄録だけということの他に,前者は機械翻訳なのに対して,後者は専門家が訳した文面が記載されています。

したがって,中国特許の和文抄録ならば,中国語を知らずとも内容を理解することができます。ただし,周知のように,特許の抄録や要約は論文の abustract などと違って,そのタイトルも含めて特許の中身を,窺い知れないようなものも多く,情報が限定されてしまいます。

また,和文抄録から抽出される文献数は前者に比べて限られており,例えば,「リチウム&電池&酸化鉄」で検索すると,

公報テキスト検索(要約の範囲)       ヒット数   84件
公報テキスト検索(要約・請求の範囲)    ヒット数  435件
公報テキスト検索(公報全文)         ヒット数 3699件
中国特許和文抄録テキスト検索       ヒット数   61件

となり,和文抄録を検索して手に入る情報は極めて不完全であることがわかります。したがって,できるだけ「公報テキスト検索」を利用したいわけです。特に知財部門では,BETTER というより,MUST というべきものです。

そこで,公報テキスト検索を利用するにあたって,機械翻訳の実力がどのようなものか知っておく必要があります。次に示すのは,公報テキスト検索を行って拾い出した中国のあるメーカーが出願している,色素増感太陽電池について特許の文面の抜粋です。

原文,機械翻訳,私の翻訳の3つを比較して読んでみてください。

原文 特許庁機械翻訳 私のアナログ翻訳
技??域 技術分野 技術分野
背景技? 背景技術 背景技術
(1)
近年来,随着不可再生能源的短缺??的加?,使得如何有效利用太?能?源愈加迫切。
>近年では、再生不可能エネルギーの問題が不足する助長につれて、どんな有効な太陽熱利用リソースかにますます切実にする。 近年,再生不可能なエネルギー資源が欠乏するという問題が昂じるにつれ,いかにして太陽エネルギー資源を有効利用するか切迫している。
(2)
太?能?池??将太?能????能的新能源?域已成??多研究者?注的?域
太陽電池はこのように太陽エネルギー変換を電気エネルギーの新エネルギー分野のためにもう多くの調査員が関心を払った分野になる。 太陽電池,(すなわち)太陽エネルギーを(直接)電気エネルギーに変換するような新エネルギー領域は多くの研究者の関心ある領域となっている。
(3)染料敏化太?能?池(DSSC)以其光???效率高,制?工???,成本低廉,?光照?度依?小等?点受到广泛?注。 色素増感太陽電池(DSSC)はその光電変換効率で高く、製造プロセスは簡単であり、コストは安く、光照明強度に小さいなどが広く利点の関心を受けることに依存する。 色素増感太陽電池(DSSC)は,その光電変換効率が高い,製造技術が簡単,コストが安い,光照射強度依存性が小さいなどの長所をもつため,幅広い関心が持たれている。
(4)
自从1991年瑞士洛桑高工(EPFL)M.Grtzel教授??的研究小?在?技?上取得突破以来,世界各国科研机?均投入大量?金?行研?
以来で1991年のスイスローザンヌ高工(EPFL)M.Grtzelがリーダーを教授する研究グループはこの技術上に突破を取得する、世界各国研究機関は全部大量の資金を投入して研究開発する 1991年に,スイス連邦工科大学ローザンヌ校(EPFL)のM.Grtzel教授が指導する研究グループが当該技術のブレークスルーを得て以来,世界各国どの研究機関も大量の資金を投入して研究を推進している。
?明内容 発明の開示 >← 同じ
其中所述微波?理的功率?0.2〜5千瓦。 >前記マイクロ波処理の電力は0.2〜5キロワットとさせる。 ← 同じ
?佳地,微波?理的???1〜20分?。 好ましく、マイクロ波処理の時間は1〜20分とする。 ← 同じ
細かく言えば,「好ましくは,」すべき
?佳地,所述半?体薄膜的厚度?5〜30μm。 >好ましく、前記半導体薄膜の厚さは5〜30μmとする。 ← 同じ
?佳地,所述染料溶液中染料的?度?0.lmmol/L〜5mol/L。 好ましく、前記染料水溶液中染料の濃度は0.lmmol/L〜5mol/Lとする。 ←同じ
「染料」でも間違いないが「色素」とした方が統一感がある。
附??明 >図面の簡単な説明
?1?利用?施例1敏化制得的光??所?装的?池在AMl.5,1000W/m2?准??条件下?得的J-V曲? 図1はAMl.5に実施例1増感獲得した光アノードが組み込む電池を利用し、1000W/m2標準試験条件は計測して得ることができたJ−V曲線を下りとする; 図1は実施例1によって増感された光アノード(電極)が組み込まれた電池を利用し、AM l.5,1000W/m標準試験条下で計測して得られたJ−V曲線である。
本?明中,所述光??可包括??基底及形成于所述??基底上的半?体?化物薄膜,所述半?体?化物薄膜???二?化?薄膜。 本発明中に、前記光アノードは導電性ベースの底および前記導電基板上に形成する半導体酸化物フィルムを含むことができ、前記半導体>酸化物フィルムは二酸化チタン薄膜が好ましい。 本発明では,前記光アノードとして,半導体基板,および前記半導体基板上に形成された半導体酸化物薄膜を含むことができ,前記半導体酸化物としては二酸化チタン薄膜が好ましい。
具体?施方式 発明を実施するための最良の形態 ← 同じ
以下?合附?和下述?施方式?一??明本?明,?理解,附?及下述?施方式?用于?明本?明,而非限制本?明。   以下に下記実施形態と図を結合して本発明を更に説明し、理解するべく、図面および下記実施形態はただ本発明を説明して、特に制限しない本発明。 以下,添付の図面と下記実施形態で本発明を更に説明するが,図面および下記実施形態はただ本発明の説明のために用いるのであって,本発明を制限するものではない。


機械翻訳はなんとも微妙なところではないでしょうか。訳語の選択については特許庁がかなり介入しているらしく,特許らしい表現が見られます。「具体?施方式」 を 「発明を実施するための最良の形態」 と翻訳しているのは,審査官が強制介入しないことにはこうはなりませんよね。

機械翻訳の特徴として,

型にはまった専門的な文章・用語は正確である。
短文ならば正確である。

ということができます。逆に言えば,長文であったり,特許特有の表現から外れると誤訳どころか支離滅裂な日本語になってしまうことが分かります。

中国語は日本語同様に,主語が省略されたり,動詞が裸のまま文中にたくさん現れたりするので,どれが本当の述語動詞なのか,それともそもそも述語動詞がない文章なのか,それを機械(人工知能)に判断させるのはたいへん難しいと思います。

実際,背景技術の(3)では,述語は「受到」であるべきところを「依?」を述語としたために機械は誤訳しています。専門家(研究者)ならば,色素増感太陽電池は,シリコンなどの無機太陽電池に比べて,光の弱い曇天時の発電効率の低下が少ないという長所を知っているので,このような間違いは犯さないと考えられます。

最近は,人工知能の進歩が著しいのですが,言語とは直接関係ない技術的な知見を翻訳に結び付けて利用することは現状ではほぼ不可能なのでしょう。

科学技術英語は,専門用語さえ覚えてしまえば簡単といいますが,それは英語がかなり論理的な文法体系だから言えることで,中国語では,(もちろん日本語→英語も)そう簡単ではないと思われます。

もちろん,特許庁の機械翻訳はまるで役立たずというのではなく,うまく利用すれば大変価値のあるサービスです。ネット上の他の無料機械翻訳と比較すれば,特許庁の機械翻訳はよくできていると思います。以下はネット上のある無料サイトで(3)を翻訳した例です。

「染料敏化太陽電池(DSSC)はその光電の転換した効率の高さによって、工業技術シンプルさを調製して、コストは安くて、照明強度に小などの長所に広く関心を払われるように頼みます。」

専門用語が適切でないことはもちろん,原文の構文も全く掌握できていないのが分かります。

結論: 機械翻訳された文章だけを読んでも特許の内容を正確に理解することは現状でも,おそらく近未来でも不可能と推測する。ただし,専門用語を辞書で調べる手間を省くことには利用できる。よって,原文をスラスラ読めるようになればベストであるが,機械翻訳を有効利用するためにも中国語の基本文法を学ぶことは有用である,と我田引水してこの話を終わります。

2.数の表現

後半は数に関係した中国語表現の話をしておきます。

小学1年生も数字や時計,暦の読み方から言葉を学び始めますので,我々もそういたしましょう。

1-99までは日本語とまったく同じ,一(yi),二(er),・・・,九十九(jiushijiu) と中国でも読み書きます。

100から少しだけ日本語と違ってきます。

100,1000 は「一百(yibai),一千(yiqian)」

と読み書きします。↑日本語では百,千の前ではふつう,一をつけません。

10000 は「一万」と書きますが,これは日本語も同じでした。

それから数字の間に 0 が現れるときに,日本語では省略して何も言いませんが,中国語ではきちんと一回だけ零(ling)と読みます。

103,1003 は「一百零三,一千零三」,

特許ではほとんど算用数字しか使いませんが,これくらいは覚えておきましょう。

数の2だけは意味の違いで別の言い方があります。

二 : 数を数えたり順番を示すときに用いる
? : 数量を示すときに用います。日本語の「ふたつ」に相当します。

例えば,

日本語の二人(ふたり)は中国語では,「?个人

となります。

分数は,

3と2分の1        三又二分之一

となります。

量詞

ここで, ge [ 個 ] という文字が入っていますが,中国語でも日本語と同様に物の量を数えるときには,物ごとに決まった量詞があって,数字と名詞の間に置きます。日本で,一枚の皿というように中国語でも,「一个?子(yige diezi)」と言います。いくつか例を書いておきます。


ge
人,物
抽象的な事柄
一个人 yige ren
一人
? [頭]
tou
家畜 三?羊 santou yang
三頭の羊

zhi
動物 一只狗 yizhi gou
一匹の犬

pian
論文

一篇?文 yipian lunwen

一編の論文

?
zhang
写真,契約書 ??画 liangzhang hua
二枚の絵

量詞は物の数だけ一つずつその都度,覚えていくしかありません。

数字の桁数はを用います。

?入八数的密?       八桁の暗唱番号を入力する。

特許文献の翻訳例で示した,

半?体薄膜的厚度?5〜30μm。

のように,単位を伴った物性値を示す際には,?が用いられます。?(wei)は日本の「為」(なす)という字ですが,ここでは,「〜である」という英語の be 動詞の役割を果たしています。他には,〜のためであるという意味で,そのまま動詞として,または,前置詞,因?(yinwei),?了(weile)としてよく使用されます。

?名,不?利  名声や利益のためではない。
因??个事?   この事実のために 
?了?始      スタートさせるためには

序数

次に,英語の first,second,third,・・・ に相当する序数の表し方は,

第〜+形容詞+名詞](中国語) =(第)〜番目(日本語

となります。例を挙げておくと,

?座山是世界第二高的山 (この山は世界で二番目に高い山です。)
zhezuoshan shi shijie dier gao de shan


動量詞   ←回数を表す

「三回投げる」の「3回」などの修飾語は動詞や形容詞の後ろに置きます。(日本語と順序が逆)

S+V+動量詞+O(一般目的語)
S+V+O(代詞)+動量詞

という構文になります。例は,

我一天吃四??     私は一日に四度飯を食う。
wo yitian chi sidungfan
?了?次方向    方向を2度変えた。
zhu?n le li?ng ci f?ng xiang
我打了他一次      私は彼を1回殴った。
w? d? le t? y? ci
?秒?振?一次?一赫?    1秒間に1回の振動を1ヘルツとする。
meimiaozhong  zhendon yici wei yihezi
一下       ちょっと待ってください
deng yixia

目的語が,場所,人名のときは,どちらの順序でも構いません。

〇 去??次中国    中国に2度行ったことがある。
〇 去?中国?次

時量詞   ←時間の幅を表します

動詞や形容詞の後ろに置く(日本語と逆)

例を見てみます。

我?天?三十分?      私は毎日三十分間走ります。(目的語がないとき
??半分??歇一次    毎回30秒ごとに1回停止する
me? zhu?n ban f?n zh?ng jian xi? y? ci  

?というのが時量詞です。「間歇」(jianxie)は難しい単語ですが,米国イエローストーン国立公園の「 間歇泉」と同じだと聞けば覚えやすいでしょう。

時量詞は目的語がある持続性の動詞のときは,やや複雑な表現があります。

S+V+時量詞+()+O(一般名詞)
S+V+O+V+時量詞

具体例です。どちらも同じ意味ですが下はやや強調した表現です。

我打了三分???
我打??打了三分?     私は3分間電話しました。
wo dadian hua dale sanfenzhong

2行目は実に中国語らしい表現ですね。

人称代名詞が目的語の場合,動詞の直後に置くことができます。

S+V+O [人称代名詞]+時量補語
我等了?四年           私は彼女をもう四年待っている。
wo deng le ta si nian

持続性のない動詞 来,去,?? などの場合は,

S+V[持続性なし]+・・・+時量補語
?日本已?四年了     彼女は日本に来てもう四年が経つ。
ta lai riben yijeng sinianle

という語気助詞  で,「〜してから ・・・の時間が経つ」 ということを表現します。  

日時の表現について表にまとめると次のようになります。

日本語
二秒
時点
二秒 二分 二点 二号 星期二 二月(?) 二年
二秒間
時量詞
?秒? ?分? ?(个)小? ?天 ?(个)星期 ?个月 ?年
- 半分? 半(个)小?
半个??
半天 - 半个月 半年

今日はこれでおしまいです。 下个月?!


[目次へ]



動詞の前に時量詞がくる場合

…時間内で〜する

公共汽?十分?能到大学     バスは10分で大学に到着します。
我一个月看?次?影        私は月に2回映画を見ます。

否定文ではその期間事柄が発生しないことを表します。

我三个月没喝酒           私は3か月間お酒を飲んでません。
?一个星期不能上班         あなたは1週間出勤してはいけません。
好久没?了              お久しぶりです。(挨拶)