TUC: TinyUtf8Converter β version


TUC: TinyUtf8Converter β version

Last update: 2008/8/30
Naohiro Matsumura <>

はじめに

ファイルの文字コードをUTF8に変換するフリーソフトです.

インストール

使い方

ファイルを にドラッグすると,文字コードを UTF8 に変換してファイルに保存します.ファイル名には _utf8 が付与されます.GUIはありませんのでダブルクリックしても何も起こりません.

独り言

Windows版Wekaの入力ファイルに日本語が入っていると文字コードをUTF8にする必要があったので作りました.Mac版WekaではShift-JISのままで読み込めるのになぁ.

ソースコード

短いのでソースコードも載せておきます.

#!/usr/bin/perl

use strict;
use warnings;
use Encode::JP;
use Encode qw/from_to encode decode/;
use Encode::Guess qw/euc-jp shiftjis 7bit-jis/;

my $file = shift;
exit unless $file;
exit unless -e $file;
exit unless $file =~ /(.+)\.(.+)$/;
my $file2 = "$1_utf8.$2";

open IN, "<", $file;
my $data = join '', <IN>;
close IN;

my $enc = guess_encoding($data);
from_to($data, $enc->name, 'utf8') if ref $enc;

open OUT, ">", $file2;
print OUT $data;
close OUT;

履歴