[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [freebsd-fdp] OT: charset mess



On Wed, Apr 14, 2004 at 09:13:34AM +0300, Peter Pentchev wrote:
> On Wed, Apr 14, 2004 at 01:31:30AM -0400, lou wrote:
> > 
> > Ima drugo reshenie, da convertvam sichki emails v archive ot neshto kum utf-8,
> > good thing about utf-8 che e unified ;) niakoi da ima neshto protiv?
> > 
> > sichki postove sa v utf-8 sega, no shte triabva da go pipenia naikade
> > posredata, niakoi da ima po dobra ideai?
> 
> Не можеш да обърнеш всичко в UTF-8; ще загубиш информация, ще промениш
> съобщенията - примерно PGP подписите на хора, които пишат в нещо, различно
> от UTF-8 (yours truly ;), няма да са валидни.
> 
> Р?наче всеки разумен софтуер Р·Р° представяне РЅР° неща РІ уеб Р±Рё трябвало РґР°
> може да си прави вътрешно конвертирането... друг е въпросът дали
> наистина го правят, но *би трябвало* :(  Остава малкият проблем с
> търсенето из архивите де, но и там...  Хмм, бе чудя се дали да не седна
> да погледна как са направени нещата и дали няма нещо вече измислено, но
> определено не ми се вижда изобщо чиста идеята за forcible conversion на
> съобщенията :(

Ако не греша, Любо смята да конвертира *само* съобщенията в (за) архива - т.е.
ние ще продължим да си ги получаваме така както са си изпратени и с валиден
подпис. Конвертирането към UTF-8 ще направи подписите невалидни в уеб 
интерфейса, но до колкото там няма 'валидизатор - това е найстина пратено от
Петър Пенчев' то това не би трябвало да е голям проблем.

Мене повече ме притеснява факта, че писмото може да е пратено на произволен
енкодинг - за ден два имаме UTF-8, CP1251, KOI8-R и даже емаил с кирилица 
без зададен енкодинг (ISO8859-1) ако не греша.

Т.е. ако на някой емайл клиента му не set-не коректно енкодинга, как това
ще се отрази на архива?

Р? какво ако РЅСЏРєРѕР№ отговори РЅР° емайл писан РЅР° UTF-8 СЃ CP1251?
Аз го направих вчера и mutt-a ми просто конвертира всичко в CP1251, но всеки
клиент може да го направи по произволен начин...

Търсенето ще бачка ли коректно с UTF-8?

С две думи: Ако iconv отгатва коректно как да конвертира *шантави* емайли и го
прави коректно - нямам против за това което предлага Любо.


В крайна сметка можем просто да тестваме как се получава... :-)

Cheers,

РњРёСЂРѕ