מה זה ASCII, UNICODE ו- UTF-8. המחשב האישי הוא מחשבון מצוין, כל מה שהוא עושה זה לבצע חישובים עם מספרים. לא מצליח להבין טקסט. לכן, קודים הם דרכים להפוך מידע טקסט לנתונים מספריים, המובנים למחשב האישי.

מהם קודי ASCII, UNICODE ו- UTF-8:

ASCII

ישנם קודים שונים הידוע ביותר הוא הקוד ASCII (קוד אמריקאי סטנדרטי להמרת מידע). זהו תקן אמריקאי, אך הוא אחד הנפוצים ביותר בעולם. הוא קוד ASCII מגדיר במדויק את ההתאמה בין סמלים למספרים עד למספר 127.

לכן, המספר 97 משמש לייצוג "a". לייצג את ?, נעשה שימוש בקוד 63. חלקם (פחות מ 32) הם קודי בקרה ואין להציג אותם. לדוגמא, קוד 10 מדלג על הקו, קוד 7 מצפצף על המחשב האישי, בין יתר הפונקציות.

אבל מה עם תווים מודגשים? כן, אמריקאים לא חשבו על שאר העולם. לעתים קרובות אנו משתמשים בקודים 128 עד 255 למבטאים, אך הקודים שונים ממדינה למדינה. זה לא מעשי להחליף מסמכים. אז היינו צריכים למצוא קוד מעשי יותר: UNICODE.

UNICODE

במקום להשתמש רק בקודים 0 עד 127, UNICODE משתמש בקודי ערך גדולים בהרבה. עם זה אתה יכול לייצג כל הדמויות הספציפיות רב-שפה. קודים חדשים מוקצים באופן קבוע לדמויות חדשות כמו לטינית (מבטאים או לא), יוונית, קירילית, ארמנית, עברית, תאילנדית, Hiragana, Katakana וכו '. האלף-בית הקנג'י הסיני בלבד מכיל 6.879 תווים.

UNICODE מגדיר התאמה בין סמלים למספרים. אפילו אם UNICODE היה מפותח, השימוש בו היה מועט בהשוואה ל- ASCII. אז אל תשלחו למישהו הודעת UNICODE - כנראה שהם לא יוכלו לקרוא אותה. אפילו עבור מתכנתים, לא תמיד קל לתפעל.

אם כי, אנו יכולים לומר זאת, התבנית הזו צומחת יותר ויותר. שפות Java y פיתון כבר נתמכים על ידי UNICODE. רוב ה מערכות הפעלה (Windows, Linux, MacOS X וכו ') מסוגלים לקרוא אותו.

UNICODE בפועל: UTF-8

בתיאוריה, UNICODE טוב מאוד. אך בפועל הסיפור שונה. באופן כללי, ב- UNICODE, דמות משתמשת הבתים 2. במילים אחרות, כל טקסט משתמש בשטח כפליים מאשר ב- ASCII. זה בזבוז. תווים הדורשים UNICODE הם נדירים. אבל יש טריק: ה UTF-8.

טקסט ב- UTF-8 הוא פשוט, הוא נעשה כולו ב- ASCII, וכאשר אנו זקוקים לדמות UNICODE, אנו משתמשים בתו מיוחד, האומר 'שימו לב, התו הבא הוא ב- UNICODE'. בכל מקרה, כדי להיות קפדניים יותר, אנו מציינים את תחילת הקובץ, שנמצא ב- UTF-8, עם תווים מיוחדים.

UTF-8 מפגיש את היעילות של ASCII ואת טווח ההגעה של UNICODE. למעשה, UTF-8 אומץ כסטנדרט לקידוד קבצי XML. מרבית הדפדפנים הנוכחיים תומכים גם ב- UTF-8 ומזהים זאת באופן אוטומטי בדפים HTML.

כיצד לעשות בדפי אינטרנט

אם אתה נכנס ישירות לכן בדף אינטרנט זה לא טוב. עליך לבחור אחד משלושת הפתרונות הבאים:

השתמש בישויות HTML ושם '> הוא' במקום 'si'

עזוב את ה 'siבכל מקרה וציין את קידוד התווים בו תשתמש בתחילת קובץ ה- HTML (בתג Head):

meta http-equiv = "סוג תוכן" content = "text / html; charset =ISO-8859-1 "

(ISO-8859-1 הוא מערך התווים הלטיני שפועל במערכת Windows)

עבוד ישירות ב- UTF-8 בעורך ה- HTML שלך (במידת האפשר). ואז הוסף:

meta http-equiv = "סוג תוכן" content = "text / html; charset = UTF-8"

ISO-8859-1 מתאים לרוב השפות הלטיניות או המערביות (אנגלית, צרפתית, גרמנית, ספרדית וכו ') ו- UTF-8 יהיה הכרחי עבור שפות אחרות (יפנית, עברית וכו ').

עליכם לבחור אחת משלוש האפשרויות הללו כדי לענות על הצרכים שלכם.