euc-jp→SHIFT-JISへの文字コード変換について

フォーラム(掲示板)ルール
フォーラム(掲示板)ルールはこちら  ※コードを貼り付ける場合は [code][/code] で囲って下さい。詳しくはこちら
アバター
Ciel
記事: 252
登録日時: 8年前

euc-jp→SHIFT-JISへの文字コード変換について

#1

投稿記事 by Ciel » 8年前

久しぶりの投稿です。

大分前に同じ質問をしたんですが、その時に解決できなかったので再度質問致します。

Winsockを使ってあるWEBページのデータ(html)を取得してきて、色々やろうと思ってるんですが、
その取得したいページの文字コードがeuc-jpなので、ウィンドウに表示するにはSHIFT-JISに変換してやる必要があります。

以前に質問した際に、toyoさん(だったかな?)に教えて頂いた方法でやろうと思ったのですが、
その前の段階で躓いてしまいました。

winsockを使って取得してきたデータをそのままファイルで書き出したら↓のようになってます(一部)

option> <option value="23">ーヲテホクゥ</option> <option value="21">エ・ゥ</option>

当然文字化けしてます。(書き出されるときはSHIFT-JISで書き出されるからかな?)
書き出す前のメモリにデータを保持してるときのイメージもあまり掴めてません。

このデータをConvertINetMultiByteToUnicodeの関数を使って、SHIFT-JISに変換しようとするんですが、
どの状態までデータを整形してから、この関数を使えばいいのかがわからないです。

変換する必要のない、a-zA-Zなどの文字を削除した状態でこの関数を使うのか?
また、
\xe3\x83\xa9\xe3\x83\xab\xe3\x82\xaf\xe3\x82\xa2\xe3\x83\xb3\xe3\x82\
みたいな16進数に整形した形で使うのか?

その辺がわかりません。

何かアドバイスいただければ嬉しいです。
よろしくお願いします!
oui C'est la Vie♪

アバター
lbfuvab
記事: 72
登録日時: 8年前

Re: euc-jp→SHIFT-JISへの文字コード変換について

#2

投稿記事 by lbfuvab » 8年前

とりあえず試してみるか、libIconvとかnkfやICUで変換するのも良いかなと思います。

アバター
Ciel
記事: 252
登録日時: 8年前

Re: euc-jp→SHIFT-JISへの文字コード変換について

#3

投稿記事 by Ciel » 8年前

lbfuvabさんありがとうございます。

教えていただいたものって全てライブラリですよね。
ライブラリは出来れば使いたくないんですよねぇ。

ちょっと色々EUC-JPについて調べて思いついたことがあるので、やってみてからまた来ます(´・ω・`)

追記:
文字コードについて勉強しなおして、一文字ずつ計算しなおして変換したらできました。
ありがとうございました。
oui C'est la Vie♪

閉鎖

“C言語何でも質問掲示板” へ戻る