Кирилица в получени писма

Въведение

Това са резултатите от кратко проучване на способностите на някои български уеб пощи да показват правилно кирилица в коректно изпратени до тях писма. Изборът на доставчиците на услугите за проучване не претендира за предствителност и популярност.

В края на проучването, проучените уеб пощи в България са класирани според показаните способности. Отделно българските като цяло са класирани сред рускоезичните и англоезичните.

Условия

Под коректно изпратено до съответната поща писмо, се има предвид писмо, в което текстът на тялото на писмото е кодиран в дадено кодиране, и кодирането е надлежно указано в служебното поле ContentType на електронното писмо. Всички писма са изпратени в прост текстов формат (MIME тип text/plain), а не в HTML формат (MIME тип text/html). Форматът е надлежно указан пак в служебното поле ContentType чрез своя MIME тип text/plain.

Тук не се разглеждат способностите на уеб пощите за коректно изпращане на писма с кирилица. Това ще бъде тема на отделно проучване.

Легенда на заглавията на графите

Списък теми
Дали кирилица в темата на писмо се показва правилно в списъка с получените писма
Страница писмо
Дали кирилицата в тялото на писмото се показва правилно при четене на писмо в уеб интерфейса
Писмо отделно
Понякога редом до показаното в страницата писмо има линк за показване или изтегляне на писмото отделно или в удобен за отпечатване вид

Пояснение за различните кодирания

UTF-8 (Важно да се поддържа)
Това е бъдещето. Един от най-използваните към момента варианти на Единния код на писменостите (Unicode, Уникод). В Единния код съвместимо са кодирани на практика всички писмени знаци от сегашни и отминали човешки култури.
Windows-1251 (Жизненоважно да се поддържа)
Това е кодирането, което е най-рапространено при публикуване на документи на български език. Много използвано и в документи на руски.
KOI8-R (Важно да се поддържа)
Кодирането, което е най-разпространено при публикуване на документи на руски език. Често използвано в документи на български.
ISO-8859-5 (Сравнително важно да се поддържа)
Еропейски стандарт за публикуване на документи на кирилица. Рядко употребявано
KOI8-U
Украински вариант на KOI8-R
ibm866
Стандартно кодиране на кирилица, (някога) използвано в DOS. Като такова е ползвано главно в Русия. В България специалистите навремето не са могли да ни въвлекат в този стандарт, поради което в България се използва(ло) световно неизвестното и излишно оригинално кодиране МИК. И все пак, това кодирене е било изпозлвано (и в много редки случаи навярно още се изполва) именно от българи.

Още за кодиранията на кирилица може да прочетете на една от страниците на Антон Зиновиев, посветени на "българизацията " на Линукс

Подходи за правилно показване на получаваните писма

Списък с теми на получените писма

Винаги има вероятност получени писма да бъдат в различни кодирания. Затова когато темите на различни писма трябва да бъдат показвани в една уеб страница, те задължително трябва да бъдат прекодирани към едно кодиране. Ако искаме да осигурим поддръжка на кирилицата, достатъчно е да вземете произволно кодиране за кирилица, и да прекодирате всички теми на писма към него. Така правят руските и българските уеб пощи, в различна степен.

Ако целта е да се обхванат възможно повече писмености, трябва да се ползва кодиране, което може да поддържа възможно повече различни писмености. Такива са вариантите на Unicode. Нито една уеб поща не ползва този подход.

Англоезичните уеб пощи в повечето случаи показват темите в суров вид, и те често изглеждат като маймунски знаци. Което всъщност е липса на какъвто и да било подход.

Показване на получено писмо в уеб страница

Българоезичните и рускоезичните уеб пощи ползват в интерфейса си кирилица. За да покажат писмо на кирилица в него, кодирането на теста от интерфейса и текста на писмото трябва да са еднакви. Ето защо, ако искат да поддръжат различни кодирания, българските и руските пощи нямат друг избор, освен да прекодират получените писма в стандартното кодиране, което ползват в страниците си.

Англоезичните уеб пощи могат да си позволят по-мързелив подход. Те изобщо не прекодират писмото, а направо го доставят в страница, за като декларират че е кодирана в кодирането на писмото. Интерфейсът им не страда от това, понеже което и кодиране да вземете, частта с латинската азбука в него е все една и съща.

Показване на писмото отделно

С подобни линкове някои уеб пощи се опитват да предоставят на потребителите оригиналното писмо. По този начин, ако не е успял да види писмото по нормален начин, потребителят може да търси начини да се справи сам с писмото с други средства.

Пак с подобни линкове други пощи целят просто да дадат писмото в удобна за разпечатване уеб страница. Обиковено, ако писмото е показано правилно в обичайна страница, вариантът за разпечатване също се показва правилно.

Оценките в графите

+
Коректна поддръжка. На коректно настроена система кирилицата се показва пред потребителя правилно от само себе си.
o
Обикновено показва или немарливо или мързеливо отношение на доставчика на услугата на потребителя, или че доставчикът смята, че не си заслужава да поддържа такава услуга. Кирилицата е недостъпно скрита от обикновения потребител. Но не е повредена и може да бъде възстановена от потребител с по-висока компютърна грамотност, или по стечение на обстоятелствата може случайно да бъде показана правилно, често когато нещо или всичко друго е показано погрешно.
-
Без поддръжка, кирилицата е безвъзвратно повредена и не може да бъде възстановена.
?
Неопределено: кирилицата отчасти я има, отчасти -- не.
n
Неприложимо за съответната услуга (няма или не съм забелязал линк)

mail.bg (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно

Windows-1251     +               +               +
KOI8-R           +               +               o (b2)
KOI8-U           +               +               o (b2)
ISO-8859-5       +               +               o (b2)
ibm866           +               +               o (b2)
utf-8            +               - (b1)          o (b2)

(b1) - Въпреки че mail.bg прекодира правилно темата на писмото,
       в тялото кирилицата в писмото е заличена.
(b2) - mail.bg отваря в отделен прозорец тези писма в прост
       текстов формат. При това декларира
       за тях оригиналното кодиране, но всъщност показва
       текста винаги само в Windows-1251. mail.bg или не бива да се прекодира
       писмата в Windows-1251 и да ги декларира  с оригиналните им кодриания,
       или трябва да ги декларира като Windows-1251.

dir.bg (23 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно

Windows-1251     +               +               n
KOI8-R           -               +               n
KOI8-U           -               +               n
ISO-8859-5       -               +               n
utf-8            -               +               n
ibm866           -               +               n

abv.bg (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно(**)

Windows-1251     +               +               +
KOI8-R           o               +               +
KOI8-U           o               o               o
ISO-8859-5       o               +               +
utf-8            o               +               +
ibm866           o               o               o

** Чрез линк, който отваря писмото в удобна за печат HTML страница

mailium.bg (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно

Windows-1251     +               +               n
KOI8-R           +               +               n
KOI8-U           o               o               n
ISO-8859-5       o               o               n
utf-8            o               o               n
ibm866           o               o               n

top.bg (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно(*)

Windows-1251     +               +               o
KOI8-R           - (**)          +               o
KOI8-U           o               o               o
ISO-8859-5       -               -               o
utf-8            o               o               o
ibm866           o               o               o

* Чрез линк, който запазва писмото на локалния диск в прост текстов формат,
в който заглавията на служебните полета са винаги дадени в Windows-1251,
а основният текст -- в оригиналното кодиране на полученото писмо.
** top.bg успява да покаже първите 4 символа от думата "Кирилица", но
иначе темата е поврдена, поради което оценката е -.

mail.ru (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно(**)

Windows-1251     +               +               +
KOI8-R           +               +               +
KOI8-U           +               +               +
ISO-8859-5       +               +               +
utf-8            +               +               +
ibm866           +               +               +

** Чрез линк, който отваря писмото в удобна за печат HTML страница

rambler.ru (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно

Windows-1251     +               +               n
KOI8-R           +               +               n
KOI8-U           +               +               n
ISO-8859-5       +               +               n
utf-8            +               +               n
ibm866           -               -               n

operamail.com (21 юни 2003 г. следобед)

Кодиране     Списък теми   Страница писмо   Писмо отделно

Windows-1251     o               +               n
KOI8-R           o               +               n
KOI8-U           o               +               n
ISO-8859-5       o               +               n
utf-8            o               +               n
ibm866           o               +               n

hotmail.com (21 юни 2003 г. следобед)

Кодиране     Списък теми   Страница писмо   Писмо отделно(**)

Windows-1251     o               +               +
KOI8-R           o               +               +
KOI8-U           o               +               +
ISO-8859-5       o               +               +
utf-8            o               +               +
ibm866           o               o               o

** Чрез линк, който отваря писмото в удобна за печат HTML страница

yahoo.com (20 юни 2003 г. сутрин)

Кодиране     Списък теми   Страница писмо   Писмо отделно(**)

Windows-1251     o               o               o
KOI8-R           o               o               o
KOI8-U           o               o               o
ISO-8859-5       o               o               o
utf-8            o               o               o
ibm866           o               o               o

** Чрез линк, който отваря писмото в удобна за печат HTML страница

Класация на проучените уеб пощи според графата Списък теми

Тази класация е сравнително маловажна, понеже дали ще четем темите на писмата в списъка от теми не е толкова важно, колкото да прочетем самото писмо.

За оценка + даваме 1 точкa (има поддържка), за оценка o -- нула точки (няма поддръжка), а при оценка - отнемаме 1 точка (пощата разрушава писмото).

  1. (6 точки) mail.bg, mail.ru
  2. (5 точки)
  3. (4 точки) rambler.ru
  4. (3 точки)
  5. (2 точки) mailium.bg
  6. (1 точки) abv.bg
  7. (0 точки) hotmail.com, operamail.com, yahoo.com
  8. (-1 точки) top.bg
  9. (-2 точки)
  10. (-3 точки)
  11. (-4 точки) dir.bg

Класация на проучените уеб пощи според графата Страница писмо

Тази класация е по-важна, понеже именно тя показва дали обикновеният потребител все пак ще успее да прочете получено на кирилица писмо.

Обърнете внимание, че това не е класация за най-добра поща, понеже правилното показване на писма на кирилица може далеч да не най-важният критерий, който да определя крайния избор на определена услуга.

Много по-важни критерии биха могли да са например скоростта на достъп до услугата, способността изобщо да се получават писма, обемът на пощенската кутия, цената и други.

Ще приемем, че оценка + в графата носи 1 точка (писмото ще бъде прочетено); оценка o носи 0 точки (не е положена грижа от доставчика на услугата), и - отнема 1 точка (услугата поврежда писмото). Разбира се, едно е пощата да не поддръжа старото кодиране ibm866, друго е да не поддържа жизненоважното windows-1251. Така или иначе, жизненоважното кодиране се поддържа от всички руски и български услуги, така е именно следващите по важност неща ще определят класацията.

Обърнете внимание как се класират българските услуги сред руските и англоезичните.

  1. (6 точки) dir.bg, mail.ru, operamail.com
  2. (5 точки) hotmail.com
  3. (4 точки) mail.bg, abv.bg, rambler.ru
  4. (3 точки)
  5. (2 точки) mailium.bg
  6. (1 точки) top.bg
  7. (0 точки) yahoo.com

Идеалистична класация в поддръжката на кирилица

Нека видим какво ще се получи, ако отдадем еднаква тежест на двете класации и ги обединим в една обща. Това не е коректно от гледна точка на практиката (много по-важно е писмото да се чете, а не толкова да се чете темата му в списъка с теми). И все пак ние си дължим тая класация. Дължим я на езика и себеуважението си. Защото ако една уеб поща си е направила труда да поддръжа кирилица дори и на по-маловажни места, това означава доброто й желание да бъде полезна на потребителите си. Използването на кирилица за кореспонденция в началото на XXI век все още се смята лукс или излишен риск от мнозина. За подобно лошо име на кирилицата са виновни именно некачествени програми и услуги (включително за масовата електронна поща).

Една уеб поща, била тя и безплатна, не бива да се разглежда като подаяние и харизан кон, на който зъбите не се гледат.

Кои са най-ревностните ученици на солунските братя?

  1. (12 точки) mail.ru
  2. (11 точки)
  3. (10 точки) mail.bg
  4. ( 9 точки)
  5. ( 8 точки) rambler.ru
  6. ( 7 точки)
  7. ( 6 точки) operamail.com
  8. ( 5 точки) abv.bg, hotmail.com
  9. ( 4 точки) mailium.bg
  10. ( 3 точки)
  11. ( 2 точки) dir.bg
  12. ( 1 точки)
  13. ( 0 точки) top.bg, yahoo.com

Приложение: Илюстрации

Това са снимки на уеб страници в някои от проучените услуги, подбрани с цел илюстрация на направените оценки


Списъкът с теми на шестте получени пробни писма в различно кодиране в mail.ru. Въз основа на този вид, mail.ru получава оценка + (по 1 точка) за всяко кодиране в графата Списък теми


Списъкът с теми на шестте получени пробни писма в различно кодиране в mail.bg. Въз основа на този вид, mail.bg получава оценка + (по 1 точка) за всяко кодиране в графата Списък теми


Списъкът с теми на шестте получени пробни писма в различно кодиране в abv.bg. Въз основа на този вид, за графата Списък теми abv.bg получава само една положителна оценка -- за поддръжката на кодирането Windows-1251. За останалите кодирания получава нулева оценка. С помощта на някои прийоми, в даден момент може да бъде показана коректно темата на само едно от писмата в заснетата страница. (По-долу споменатият прийом е показан в действие за получено писмо на кирилица в mailium.bg)


Списъкът с теми на шестте получени пробни писма в различно кодиране в dir.bg. Темите на всички писма с различно от Windows-1251 кодиране са повреденеи и не могат да бъдат възстановени с обичайни прийоми. Въз основа на този вид, dir.bg получава обща оценка -4 в графата Списък теми. Една положителна за писмото в Windows-1251 и 5 отрицателни за останалите.


Получено писмо на кирилица в mailium.bg. Кодирането на писмото е utf-8, а кодирането на страницата е Windows-1251. mailium.bg не се грижи за прекодирането на писмото, поради което тякото на писмото и темата му излизат в маймунки:

Все пак, писмото не е повредено и чрез насилствена смяна на кодирането, то все пак се показва, макар и с цената на повреждане на интерфейса:

Поради това mailium.bg получава нулева оценка за поддръжката си на кодирането UTF-8 в графата Страница писмо.


Единственият случай, в който mail.bg не получава положителна оценка. Само заради това mail.bg не успява да изкачи двете точки до нивото в идеалистичната класация на перфектната mail.ru. Забележете как кирилицата в тялото на писмото липсва:

Ето за сравнение същото писмо в mail.ru:


Списъкът с теми в top.bg. Изглежда пощата прави някакъв опит да покаже правилно темата на писмото в KOI8-R, но не много успешно -- темата е разрушена.