オンライン授業関連ツール等 FAQ
オンライン授業を実施する上で必要となるPC・機材・アプリ・外部サービス等の活用、さらに著作権法に関する質問項目をまとめています。目次にひととおりお目通しください。
5. 未分類項目
5.3. 文書中の一部の漢字が検索できない、書体が周囲と合わない
康煕部首(こうきぶしゅ)
Unicode(ユニコード)は事実上ほぼすべての文字に番号づけをするための取り決めであり、現代の情報処理の基盤です。
Unicodeでは、通常の漢字のほかに、漢字を構成する部首(康煕部首)にも異なる番号づけをしてそれぞれ独立した文字として扱います。このため、漢字の「月」「日」と部首の「⽉」「⽇」は、見た目は(あまりあるいはまったく)変わりませんが異なる文字として認識されます。(岡山大学Moodleでは、デフォルトのフォントの利用時には、これらの部首に四角の枠を表示して区別できるように設定しています。「入力した一部の文字に四角形の枠が表示されてしまう」参照)
文書中に康煕部首が含まれている場合、フォントによっては対応するグリフが登録されておらず代替フォントで表示するため見た目が明らかに異なってしまうほか、異なる文字であるため文書中の検索やGoogle等の検索でもマッチしないことがあります。ツールによっては同じ文字とみなすものもありますが、すべてではありませんので文書作成時に注意することが肝要です。
文書中に康煕部首が含まれる原因
WindowsやMacの通常のIMEによる文字入力では康煕部首が入力されてしまうことはありません。
使用するフォントとPDF生成ツールの組み合わせにより、テキストをコピーすると康煕部首の文字コードに変換して出力されるものがあることが知られています。(「PDFのコピペが文字化けするのはなぜか?~CID/GIDと原ノ味フォント~」で詳細に解説されているので、関心のある方はご参照ください。)
こうしたPDFからコピーしてペーストしたテキストには康煕部首が混入してしまいます。また当然、これらの文書をさらにコピーして使用すれば康煕部首が残り続けます。
トリガーとなりうるフォント
- 游書体系統のフォント(游明朝、游ゴシック等)
- メイリオ
- Noto系統のフォント(源ノ明朝、源ノ角ゴシック等)
以下のフォントでは問題は発生しません。
- MS系統のフォント(MS 明朝、MS ゴシック等)
- HG系統のフォント(HG明朝B、HGゴシックM等)
- BIZ UD系統のフォント
- UDデジタル教科書体
- 原ノ味フォント
康煕部首コードを生成しうるツール(PDF Producer [Creator])の例示
元の文書に康煕部首が含まれていないが、上述のフォントを使用すると康煕部首コードを生成しうるツール群です。元の文書に康煕部首が含まれている場合の挙動は異なります。
- macOS バージョン15.5(ビルド24F74) Quartz PDFContext [Word]
- Acrobat Distiller 25.0 (Windows) [PScript5.dll Version 5.2.2]
- Acrobat Pro 22.3.20281 [Adobe Illustrator 27.0 (Macintosh)]
- Skia/PDF m138 (Chrome 138以前でフォントによらず発生、Chrome 139で修正予定)(Edge 138は問題なし)
以下は未確認です。
- ? Qt 4.8.7 [wkhtmltopdf 0.12.6]
- ? SkyPDF Producer ver1.0.4 [SkyPDF Creator ver1.0.4]
- ? Canva [Canva]
- ? pdfFactory 3.52 (Windows NT 10.00 x64 Japanese) [pdfFactory www.nsd.co.jp/share/pdffact]
- ? DocuWorks PDF Build 11 [DocuWorks PDF Driver 7.0.6]
以下のツールは問題なさそうに見えます。
- Windows版Officeアプリ(Microsoft 365 アプリ)内でのPDFへのエクスポート(文書内で康煕部首を使用していない場合)
- JUST PDF 4
文書中の康煕部首の確認と除去
「JIS X 0208チェック」(奥村晴彦氏)のページに、文書のテキストをペーストすることにより、康煕部首が含まれているかどうかを確認することができます。また、康煕部首のほかに、JIS X 0208の範囲外の文字(一部の人名漢字や記号を含む)もチェックすることができます。JIS X 0208は、日本語対応システムでは必ず扱えることが期待される文字集合で、この範囲内であればShift_JIS等へも正常に変換できます。
「康煕部首こうきぶしゅ PDF文字化け正常化」のページでは、康煕部首が含まれているかどうかの確認だけでなく、通常の文字に変換したテキストの生成もできます。
ためしにこれらのサービスに本ページのテキストをコピー&ペーストして動作を確認してみてください。なお、これらはブラウザ内のJavaScriptのみで処理されており、テキストは外部に送信されません。