Ostatnio pracowałem nad wymianą plików w formacie CSV. PHP ma funkcje fputcsv()
i fgetcsv()
, które dbają o właściwe umieszczanie/dekodowanie cudzysłowów, więc zadanie jest trywialne. Jedyny problem polegał na tym, że zdalny system zapisywał i łykał pliki z kodowaniem Windows-1250 i znacznikami końca linii CRLF. Oczywiście można traktować iconvem tablice przekazywane do fputcsv()
i zwracane przez fgetcsv()
, przy zapisie można po każdym fputcsv()
zapisywać znacznik LF, ale to rozwiązanie niezbyt eleganckie.
Na szczęście architektura PHP 5 jest elastyczna, funkcje wyjścia/wejścia operują na strumieniach, a do strumieni można dodawać filtry. Powyższy problem można rozwiążać dodając do strumienia filtr, który dokona konwersji kodowania i znaczników końca linii. Wystarczy do tego malutka klasa:
namespace MDurys\DataBundle\StreamFilter; class CP1250CRLFFilter extends \php_user_filter { public function filter($in, $out, &$consumed, $closing) { while ($bucket = stream_bucket_make_writeable($in)) { $bucket->data = str_replace("\n", "\r\n", iconv('UTF-8', 'CP1250', $bucket->data)); $consumed += $bucket->datalen; stream_bucket_append($out, $bucket); } return PSFS_PASS_ON; } }
Plik otwieramy jak zwykle:
if (null === ($fh = fopen($path, 'w'))) { throw new FileException($path); }
Potem wystarczy zarejestrować filtr i dodać go do uchwytu naszego pliku:
stream_filter_register('windows', '\MDurys\DataBundle\StreamFilter\CP1250CRLFFilter'); stream_filter_append($fh, 'windows');
Od tej pory wszystko co zapiszemy do pliku zostanie skonwertowane z UTF-8 na CP1250, a znacznki końca linii zamienione na CRLF.