オンライン授業関連ツール等 FAQ
オンライン授業を実施する上で必要となるPC・機材・アプリ・外部サービス等の活用、さらに著作権法に関する質問項目をまとめています。目次にひととおりお目通しください。
5. 未分類項目
5.3. 文書中の一部の漢字が検索できない、書体が周囲と合わない
康煕部首(こうきぶしゅ)
Unicode(ユニコード)は事実上ほぼすべての文字に番号づけをするための取り決めであり、現代の情報処理の基盤です。
Unicodeでは、通常の漢字のほかに、漢字を構成する部首(康煕部首)にも異なる番号づけをしています。このため、漢字の「月」「日」と部首の「⽉」「⽇」は、見た目は(あまりあるいはまったく)変わりませんが異なる文字として認識されます。(岡山大学Moodleでは、デフォルトのフォントの利用時には、これらの部首に四角の枠を表示して区別できるように設定しています。「入力した一部の文字に四角形の枠が表示されてしまう」参照)
文書中に康煕部首が含まれている場合、フォントによっては見た目が明らかに異なってしまうほか、異なる文字であるため文書中の検索やGoogle等の検索でもマッチしないことがあります。ツールによっては同じ文字とみなすものもありますが、すべてではありませんので文書作成時に注意することが肝要です。
文書中に康煕部首が含まれる原因
WindowsやMacの通常のIMEによる文字入力では康煕部首が入力されてしまうことはありません。しかし、PDF生成アプリの中には、漢字を誤って康煕部首に変換して出力してしまうものがあり、こうしたPDFからコピー&ペーストしたような文書には康煕部首が混入してしまいます。また当然、これらの文書をさらにコピーして使用すれば康煕部首が残り続けます。
[TODO] 康煕部首コードを生成してしまうアプリの例示
文書中の康煕部首の確認と除去
「JIS X 0208チェック」(奥村晴彦氏)のページに、文書のテキストをペーストすることにより、康煕部首が含まれているかどうかを確認することができます。また、康煕部首のほかに、JIS X 0208の範囲外の文字(一部の人名漢字や記号を含む)もチェックすることができます。JIS X 0208は、日本語対応システムでは必ず扱えることが期待される文字集合で、この範囲内であればShift_JIS等へも正常に変換できます。
「康煕部首こうきぶしゅ PDF文字化け正常化」のページでは、康煕部首が含まれているかどうかの確認だけでなく、通常の文字に変換したテキストの生成もできます。
ためしにこれらのサービスに本ページのテキストをコピー&ペーストして動作を確認してみてください。なお、これらはブラウザ内のJavaScriptのみで処理されており、テキストは外部に送信されません。