File: chapter.plain.text.html

package info (click to toggle)
omegat 3.6.0.10%2Bdfsg-3
  • links: PTS, VCS
  • area: main
  • in suites: bookworm, bullseye, sid, trixie
  • size: 63,728 kB
  • sloc: xml: 114,044; java: 74,758; sh: 174; javascript: 108; makefile: 22
file content (148 lines) | stat: -rw-r--r-- 11,089 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
<html>
   <head>
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
   
      <title>第11章 プレーンテキストを扱う</title>
      <link rel="stylesheet" type="text/css" href="OmegaT.css">
      <meta name="generator" content="DocBook XSL Stylesheets V1.78.1">
      <link rel="home" href="index.html" title="OmegaT 3.1 - 取扱説明書">
      <link rel="up" href="index.html" title="OmegaT 3.1 - 取扱説明書">
      <link rel="prev" href="chapter.translation.editing.html" title="第10章 翻訳入力行">
      <link rel="next" href="chapter.formatted.text.html" title="第12章 整形されたテキストを扱う">
   </head>
   <body bgcolor="white" text="black" link="#0000FF" vlink="#840084" alink="#0000FF">
      <div class="navheader">
         <table width="100%" summary="Navigation header">
            <tr>
               <th colspan="3" align="center">第11章 プレーンテキストを扱う</th>
            </tr>
            <tr>
               <td width="20%" align="left"><a accesskey="p" href="chapter.translation.editing.html">戻る</a>&nbsp;
               </td>
               <th width="60%" align="center">&nbsp;</th>
               <td width="20%" align="right">&nbsp;<a accesskey="n" href="chapter.formatted.text.html">次へ</a></td>
            </tr>
         </table>
         <hr>
      </div>
      <div class="chapter">
         <div class="titlepage">
            <div>
               <div>
                  <h1 class="title"><a name="chapter.plain.text"></a>第11章 プレーンテキストを扱う<a class="indexterm" name="d0e6100"></a></h1>
               </div>
            </div>
         </div>
         <div class="toc">
            <dl class="toc">
               <dt><span class="section"><a href="chapter.plain.text.html#default.encoding">1. デフォルトエンコーディング</a></span></dt>
               <dt><span class="section"><a href="chapter.plain.text.html#OmegaT.solution">2. <span class="application">OmegaT</span> での解決方法</a></span></dt>
            </dl>
         </div>
         <div class="section">
            <div class="titlepage">
               <div>
                  <div>
                     <h2 class="title" style="clear: both"><a name="default.encoding"></a>1. デフォルトエンコーディング<a class="indexterm" name="d0e6108"></a><a class="indexterm" name="d0e6113"></a></h2>
                  </div>
               </div>
            </div>
            <p>プレーンテキストファイル(拡張子 .txt の場合が多い)には、本文テキストしか含まれていません。どういった言語なのかをコンピューターに伝える方法は、明確に定義されていません。このような場合、OmegaT はテキストがコンピューターの言語設定と同じ言語で書かれているものとみなします。ファイルが
               16 ビットでエンコードされたユニコード文字セットの場合は、特に問題は起きません。同じユニコードでも、8 ビットでエンコードされていた場合は、厄介な問題に直面します。たとえば次のような日本語のテキストがあった場合…
            </p>
            <div class="mediaobject"><img src="images/OmT_Japanese.png"></div>
            <p>… OS によっては、次のように表示されるかもしれません:</p>
            <div class="mediaobject"><img src="images/OmT_Cyrillic.png"></div>
            <p>OmegaT を実行しているコンピューターがデフォルトの言語をロシア語に設定していた場合、テキストは日本語の文字ではなくキリル文字のアルファベットで表示されてしまいます。</p>
         </div>
         <div class="section">
            <div class="titlepage">
               <div>
                  <div>
                     <h2 class="title" style="clear: both"><a name="OmegaT.solution"></a>2. <span class="application">OmegaT</span> での解決方法
                     </h2>
                  </div>
               </div>
            </div>
            <p><span class="application">OmegaT</span> には、主に3つの解決策があります。いずれも<span class="bold"><strong>設定</strong></span>メニューにあるファイルフィルターを利用します。
            </p>
            <div class="variablelist">
               <dl class="variablelist">
                  <dt><span class="term">ファイルのエンコーディングをユニコードに変更する</span></dt>
                  <dd>
                     <p>原文ファイルをテキストエディターで開き、エンコーディング <span class="bold"><strong>UTF-8</strong></span> で保存しなおします。このとき、拡張子を <code class="literal">.txt</code> から <code class="literal">.utf8</code> に変更してください。OmegaT はこのファイルを UTF-8 ファイルとして自動的に認識します。これは最も理にかなった解決策で、あなたを厄介ごとから救ってくれます。
                     </p>
                  </dd>
               </dl>
            </div>
            <div class="variablelist">
               <dl class="variablelist">
                  <dt><span class="term">プレーンテキストファイルのエンコーディングを指定する</span></dt>
                  <dd>
                     <p>拡張子 <code class="filename">.txt </code> のファイルを例に取ります。ファイルフィルターダイアログから<span class="bold"><strong>テキストファイル</strong></span>のフィルターを編集し、<span class="bold"><strong>原文ファイルのエンコーディング</strong></span>を「&lt;自動&gt;」から対象の <code class="filename">.txt</code> ファイルに適したエンコーディングに変更します。たとえば上の例で言えば、日本語に対応したエンコーディングに変更します。
                     </p>
                  </dd>
               </dl>
            </div>
            <div class="variablelist">
               <dl class="variablelist">
                  <dt><span class="term">プレーンテキストファイルの拡張子を変更する</span></dt>
                  <dd>
                     <p>たとえば日本語のファイルであれば、拡張子を <code class="filename">.txt</code> から <code class="filename">.jp</code> に変えます。次に、ファイルフィルターダイアログから<span class="bold"><strong>テキストファイル</strong></span>のフィルターを編集し、<span class="bold"><strong>原文ファイル名の構成例</strong></span>を新しく追加します。例の場合は「<code class="filename">*.jp</code>」とします。エンコーディングには、適切な値を設定してください。
                     </p>
                  </dd>
               </dl>
            </div>
            <p><span class="application">OmegaT</span> は、プレーンテキストの取り扱いを簡単にするために、デフォルトで次の拡張子に対応しています。
            </p>
            <div class="itemizedlist">
               <ul class="itemizedlist" style="list-style-type: disc; ">
                  <li class="listitem">
                     <p><code class="literal">.txt</code> ファイルは、エンコーディングを「&lt;自動&gt;」で認識します。これは、コンピューターのデフォルトのエンコーディングに合わせることを意味します。
                     </p>
                  </li>
               </ul>
            </div>
            <div class="itemizedlist">
               <ul class="itemizedlist" style="list-style-type: disc; ">
                  <li class="listitem">
                     <p><code class="literal">.txt1</code> ファイルは<span class="bold"><strong>西ヨーロッパ</strong></span>言語のほとんどに対応する ISO-8859-1 エンコーディングとして解釈されます。<a class="indexterm" name="d0e6222"></a></p>
                  </li>
               </ul>
            </div>
            <div class="itemizedlist">
               <ul class="itemizedlist" style="list-style-type: disc; ">
                  <li class="listitem">
                     <p><code class="literal">.txt2</code> ファイルは<span class="bold"><strong>中央、東ヨーロッパ</strong></span>の言語のほとんどに対応する ISO-8859-2 エンコーディングとして解釈されます。<a class="indexterm" name="d0e6236"></a></p>
                  </li>
               </ul>
            </div>
            <div class="itemizedlist">
               <ul class="itemizedlist" style="list-style-type: disc; ">
                  <li class="listitem">
                     <p><code class="literal">.utf8</code> ファイルは <span class="application">OmegaT</span> によって、(世界中ほぼすべての言語に対応する)UTF-8 エンコーディングとして解釈されます。<a class="indexterm" name="d0e6250"></a></p>
                  </li>
               </ul>
            </div>
            <p>これらは<span class="bold"><strong>[設定]</strong></span>メニューの<span class="bold"><strong>[ファイルフィルター]</strong></span>一覧で[テキストファイル]を選択し、[編集...]を押すと[フィルターの編集]一覧で確認できます。たとえば、チェコ語で書かれたテキストファイル(ほとんどの場合 <span class="bold"><strong>ISO-9959-2</strong></span> で書かれているでしょう)を扱う場合、拡張子を <code class="literal">.txt</code> から <code class="literal">.txt2</code> に変更するたけで、<span class="application">OmegaT</span> は内容を正しく解釈します。もちろん、安全のため、こうしたファイルはユニコード形式(ここでは <code class="literal">.utf8</code> ファイル)への変換を検討してもいいでしょう。
            </p>
         </div>
      </div>
      <div class="navfooter">
         <hr>
         <table width="100%" summary="Navigation footer">
            <tr>
               <td width="40%" align="left"><a accesskey="p" href="chapter.translation.editing.html">戻る</a>&nbsp;
               </td>
               <td width="20%" align="center">&nbsp;</td>
               <td width="40%" align="right">&nbsp;<a accesskey="n" href="chapter.formatted.text.html">次へ</a></td>
            </tr>
            <tr>
               <td width="40%" align="left" valign="top">第10章 翻訳入力行&nbsp;</td>
               <td width="20%" align="center"><a accesskey="h" href="index.html">ホーム</a></td>
               <td width="40%" align="right" valign="top">&nbsp;第12章 整形されたテキストを扱う</td>
            </tr>
         </table>
      </div>
   </body>
</html>