[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [freebsd-fdp] OT: charset mess
On Wed, Apr 14, 2004 at 09:13:34AM +0300, Peter Pentchev wrote:
> On Wed, Apr 14, 2004 at 01:31:30AM -0400, lou wrote:
> >
> > Ima drugo reshenie, da convertvam sichki emails v archive ot neshto kum utf-8,
> > good thing about utf-8 che e unified ;) niakoi da ima neshto protiv?
> >
> > sichki postove sa v utf-8 sega, no shte triabva da go pipenia naikade
> > posredata, niakoi da ima po dobra ideai?
>
> Не можеш да обърнеш всичко в UTF-8; ще загубиш информация, ще промениш
> съобщенията - примерно PGP подписите на хора, които пишат в нещо, различно
> от UTF-8 (yours truly ;), няма да са валидни.
>
> Р?наче всеки разумен софтуер Р·Р° представяне РЅР° неща РІ уеб Р±Рё трябвало РґР°
> може да си прави вътрешно конвертирането... друг е въпросът дали
> наистина го правят, но *би трябвало* :( Остава малкият проблем с
> търсенето из архивите де, но и там... Хмм, бе чудя се дали да не седна
> да погледна как са направени нещата и дали няма нещо вече измислено, но
> определено не ми се вижда изобщо чиста идеята за forcible conversion на
> съобщенията :(
Ако не греша, Любо смята да конвертира *само* съобщенията в (за) архива - т.е.
ние ще продължим да си ги получаваме така както са си изпратени и с валиден
подпис. Конвертирането към UTF-8 ще направи подписите невалидни в уеб
интерфейса, но до колкото там няма 'валидизатор - това е найстина пратено от
Петър Пенчев' то това не би трябвало да е голям проблем.
Мене повече ме притеснява факта, че писмото може да е пратено на произволен
енкодинг - за ден два имаме UTF-8, CP1251, KOI8-R и даже емаил с кирилица
без зададен енкодинг (ISO8859-1) ако не греша.
Т.е. ако на някой емайл клиента му не set-не коректно енкодинга, как това
ще се отрази на архива?
Р? какво ако РЅСЏРєРѕР№ отговори РЅР° емайл писан РЅР° UTF-8 СЃ CP1251?
Аз го направих вчера и mutt-a ми просто конвертира всичко в CP1251, но всеки
клиент може да го направи по произволен начин...
Търсенето ще бачка ли коректно с UTF-8?
С две думи: Ако iconv отгатва коректно как да конвертира *шантави* емайли и го
прави коректно - нямам против за това което предлага Любо.
В крайна сметка можем просто да тестваме как се получава... :-)
Cheers,
РњРёСЂРѕ