Webツール 文字化け変換を使ってみた

ご注意!
このサイトは文字化けを変換するサービスを提供していません。


この記事「Webツール 文字化け変換」は「文字化け」というキーワードでアクセスが異常に多いのですが、元の本文は私が文字化けが解読できずに困ったのでどうすればよいかという程度のたいした記事ではありません。

ウエブサイトが文字化けしていたら先ず表示からエンコーディングで次々と変更替させててみますが、全て試してもまだ文字化けしている場合は今のところはどうしようもないそうです。

最近はウエブサイトを検索して表示されるアドレスの横の三角マークをクリックしてキャッシュで見ています。

2012年2月に見つけた文字化けを解読してデコードするサービスの記事です。
文字化けして読めない文書を解読できる「もじばけらった
文字化けの文字列を入力する枠のすぐ下にある文字コードを変えてトライしてみると何かが当る可能性ありだそうです。 その下の文字コードは保存された後の文字コードとなっているそうです。
ですが、この記事の元記事で記述した%C3%C3%DE%A8%A5%B3%A8%D9%BF%DDは某サイトのツールでテディ・ウィルソンと解読されたのですが、同じく”繧 繝 ウ 繝翫 繝舌 う 繝 ィ”も「もじばけらった」ではデコード出来ませんでした。



ここかららが2008年に文字化けについて投稿した本来の記事です。
現在私が毎日のように利用している利用している文字化け変換サービス「変換 TAG index」のサイトのリンクは当ブログの右サイドバーの真ん中(3番目)にあります。

※時々見かける文字化け解読ツールはダウンロードするタイプですがこの「変換 TAG index」は普通のサイトです。
この「Web便利ツール/URLエンコード・デコードフォーム - TAG index」のサイトで一番下にあるデコードの欄で文字化けが変換できます。
「%83e%83X%83g」のような文字列を枠内に入力(コピペ)して下の「デコード」ボタンをクリック!

ところが最近になってブラウザをsafariに変えたせいか、私がコピーした文字列が合わないのか一度で変換されず、デコードされた文字列を再度デコードして解読できました。この時エンコードはデフォルトです。
例として「 %25E3%2582%25AF%25E3%2583%25AA%25E3%2582%25B9%25E3%2583%2586%25E3%2582%25A3」をデコードすると「%E3%82%AF%E3%83%AA%E3%82%B9%E3%83%86%E3%82%A3」、さらにデコードすると「クリスティ」と解読できました。
ところがところがです、「 %25E3%2581%2595%25E3%2581%2588」をデコードしたところ「%E3%81%95%E3%81%88」となったので再度デコードしたら結果が「縺輔∴」でした。
それでは「 %E3%82%88%E3%81%A3」をデコードしてみたら、「 繧医▲」
ブラウザのサファリは文字化けするとか、こちらにいたっては全くデコードできません。 「リトル・リチャードãâ」
むむむ。。。
これは?
リァル���ァル��ッリ」 リィリアル韓ウリェル・� リアリァル�朧�ァル�
うー、むむむ。。。

日本のYahoo!は文字コードがHTMLファイル共に日本語(EUC)だそうですが、これがそのまま英語のサイトで表示されるとハテナ(??????????)の羅列になるようです。

●その後に発見した文字化け解読ツールのサイトは現在は運営されていないようですが
上記の「TAG index」でもデコード出来なかった文字列の”%C3%C3%DE%A8%A5%B3%A8%D9%BF%DD”をテキストエリアに入力してURLデコードをクリックすると下の結果欄に”テディ・ウィルソン”と表示されました。 お見事!
「文字化け暗号・解読つーる」は2010年秋に気が付いたのですが暫く閉鎖するそうですのでトップページのリンクから外しました。(http://ohta.oioi.jp/cgi-bin/ango.cgi)
以上のサイトにお世話になって文字化けは全て解読、鬼に金棒!でした。

と思ったのにこれが解読できない。
繧 繝 ウ 繝翫 繝舌 う 繝 ィ


私は最近はブラウザをGoogle Chrome(グーグル・クローム)を使用しています。
時々文字化けしているサイトがありますがどうによしようがありません。
そのサイトの文字コードの設定が一致していないのでしょうか。サイトの運営者がテンプレートや各ページで複数あるなかの文字コードを明確に一致させるように気をつける他はありません。
ちなみに私はインターネットでは基本となっているUNIXのEUCコードではなくUnicodeとUCSで使用できるUTF-8を使用しています。(データ量増大することやセキュリティの問題があることが難点だとか。)
文字コードをUTF-8にしている私のブログが文字化けして見える方は? → http://www.audio-visual-trivia.com

ちなみに昔々私がYahoo! Geocities(geocities.co.jp)で作ったウエブサイトがありますが、最近アクセスしたところなぜかトップページだけが文字化けしているのです。charsetはECUと記述されているのですが私のブラウザでデフォルトとなっている文字コードを表示からテキストエンコーディングをECUに変更すると見られるようになります。おかしいと思って他のページのソースをみてみるとcharset=EUC-JPとなっていました。特に私が設定したわけではないのでよく分かりません。

※ちなみに文字コード変換ソフトのダウンロードはVectorにあるそうです。(私は未使用)
文字コード変換ソフトいろいろ ダウンロード Vector




ここからが本来の記事でした。
私のブログに検索で入ってきた語句に「雫勺射酌漆捨釈尺漆借鴫、ホサ鍗ー」というのがありました。これはどうやらインターネットでは不具合を生じる日本語特有の半角カタカナで書かれたらしく文字化けしていて読めません。ちなみに私のブログもコードはユニコード(UTF-8)です。
こんな漢字ばかりの文字化けは文字化けを修復しないとなりません。
ちなみに「%83s%81[%83^%81[%81E%83K%83%93 %83T%83%89%83{%81[%83%93」なんていうのも入ってきました。

① アットマーク・アイティにあるようにエンコードを変えてみるのは初歩の段階です。

それでも駄目だったので、簡単に出来る
② Web便利ツール/URLエンコード・デコードフォーム - TAG index」というサイトにアクセスしてみました。こちらのURLエンコード・デコードフォームではURLエンコード、またはデコードのフォームに文字列を入力して、変換用のボタンを押すだけで解読してくれます。
③ 同じくMIMEエンコード/デコード確認ツールでも”MIME(Q)デコード後、SJIS変換(*1)”では同様の結果でした。

現在「Hot'n Cool」ブログのサイドバーにリンクしてあるのは「変換 TAG index」のみです。

ちなみに数字だけの方はURLエンコードされて読めなくなった文字列を、再び読める状態に変換する”デコード”をしてみたら見事に「ピーター・ガン サラボーン」と解析されました。
%B2%DD%A5%B8%DE%AF%C4%DE%A5%B6%DD%CA%DF%C6%B0 %C3%DE%C6%BD%A5%B8%B4%B2%C4%DE%82%AA%93%F1%96%F0
上記の暗号は「イングッドカンパニー デニスクエイドが二役」と解析されます。なんだかスパイの暗号を解読しているような気になってきます。

上記のフォームに問題の「雫勺射酌漆捨釈尺漆借鴫、ホサ鍗ー」を入力して”デコードする”ボタンをクリックすると「エルビスプレスリーの寺牋」と表示されました。なるほど、「プレスリー」を検索してきたのですね。しかし「寺牋」とはいったい何でしょう?

その後、メールの文字化けを解読してくれるツールがあることを知りました。
私の場合はメールの文字化けは経験がありませんが、今後のため下記にリンクします。
文字化けしたメールの修復 kanzaki.com


「寺牋」が変換出来た方の情報をお待ちします。
追加! 「Clo谷rec」も解析をお願いします。
「Rene Clo谷rec」はフランス語のアクセント付きの”René Cloërec”でした。

追記:
上記の「寺牋」は駄目でしたが、さくっと変換できる「URLエンコーダ 」を見つけたのでブログのトップページに貼ってあります。

携帯向けツールを取り扱っているツール専門サイトだそうです。
文字化けを解読して喜んでいちゃいけませんが。

☆ブログの右のサイドバー中ほどに、自分のサイトにアクセスがあったIPを調べる「IPアドレス検索」へのリンクが貼ってありますが、その下の3個は全て文字化け変換」をしてくれるサービスを提供するサイトのリンクです。
上から順に利用していますが、大抵は一番上の「変換 TAG index」でデコードしています。
① 変換 TAG index
② URLエンコーダ
③ 変換 MIME

[PR]
by koukinobaaba | 2008-01-15 20:12 | 面白記事
<< 本日のゆうご君です。 ファビオ・テスティ Fabio... >>