ตัวอักษรเปอร์เซีย

จากวิกิพีเดีย สารานุกรมเสรี
ข้ามไปที่การนำทาง ข้ามไปที่การค้นหา

อักษรเปอร์เซีย ( เปอร์เซีย : الفبایفارسی , romanizedAlefbā-ye Farsi ) หรืออาหรับสคริปต์เป็นระบบการเขียนที่ใช้สำหรับภาษาเปอร์เซียพูดในอิหร่าน ( ตะวันตกเปอร์เซีย ) และอัฟกานิสถาน ( Dari เปอร์เซีย ) ภาษาเปอร์เซียที่พูดในทาจิกิสถาน ( Tajiki Persian ) เขียนด้วยอักษรทาจิกิสถานซึ่งเป็นอักษรซีริลลิกฉบับดัดแปลงตั้งแต่สมัย โซเวียต

อักษรเปอร์เซียสมัยใหม่ได้รับมาจากภาษาอารบิกโดยตรง หลังจากที่มุสลิมพิชิตเปอร์เซียและการล่มสลายของSasanian จักรวรรดิในศตวรรษที่ 7 อาหรับกลายเป็นภาษาของรัฐบาลและโดยเฉพาะอย่างยิ่งศาสนาในเปอร์เซียสองศตวรรษ

ทดแทนของสคริปต์ปาห์ลาวีด้วยตัวอักษรภาษาเปอร์เซียในการเขียนภาษาเปอร์เซียถูกทำโดยราชวงศ์ SaffaridและSamanid ราชวงศ์ในศตวรรษที่ 9 มหานคร Khorasan [1] [2] [3]ส่วนใหญ่เป็นแต่ไม่เฉพาะจากขวาไปซ้าย ; นิพจน์ทางคณิตศาสตร์ วันที่ที่เป็นตัวเลข และหน่วยแบริ่งตัวเลข ถูกฝังจากซ้ายไปขวา สคริปต์เป็นแบบเล่นหางหมายถึง ตัวอักษรส่วนใหญ่ในคำเชื่อมต่อถึงกัน เมื่อพิมพ์แล้วโปรแกรมประมวลผลคำร่วมสมัยจะรวมรูปแบบตัวอักษรที่อยู่ติดกันโดยอัตโนมัติ

จดหมาย

ตัวอย่างการแสดงกฎสัดส่วนของรูปแบบการประดิษฐ์ตัวอักษรของNastaʿlīq

ด้านล่างนี้เป็นตัวอักษรเปอร์เซียสมัยใหม่ 32 ตัว เนื่องจากสคริปต์ใช้ตัวสะกด ลักษณะของตัวอักษรจึงเปลี่ยนไปตามตำแหน่งของมัน: แยก, ชื่อย่อ (รวมทางซ้าย), อยู่ตรงกลาง (เชื่อมทั้งสองด้าน) และสุดท้าย (รวมกันทางขวา) ของคำ [4]

ชื่อของจดหมายส่วนใหญ่เป็นชื่อที่ใช้ในภาษาอาหรับ ยกเว้นการออกเสียงภาษาเปอร์เซีย เพียงชื่อเดียวที่ไม่ชัดเจนคือเขาซึ่งจะใช้สำหรับทั้งحและه เพื่อความเข้าใจที่พวกเขามักจะเรียกว่าHA-เจ้าจิมมี่ (ตัวอักษร " จิมเหมือนเขา " หลังจากที่จิม , ชื่อตัวอักษรجที่ใช้รูปแบบฐานเดียวกัน) และHA-เจ้าทำ CESM (ตัวอักษร "สองตาเขา " , หลังรูปอักษรกลางตามบริบทـهـ ) ตามลำดับ

ตารางภาพรวม

# ชื่อ
(ในภาษาเปอร์เซีย)
ชื่อ
(ทับศัพท์)
DIN 31635 IPA Unicode รูปแบบบริบท
สุดท้าย อยู่ตรงกลาง อักษรย่อ โดดเดี่ยว
0 ฮะมะซะ แฮมเซ่[5] Glottal stop [ʔ] U+0621 ไม่มี ไม่มี ไม่มี
U+0623 บัญชีผู้ใช้นี้เป็นส่วนตัว อ้า
U+0626 บัญชีผู้ใช้นี้เป็นส่วนตัว บบ ลิ้ง ลิ้ง
U+0624 ؤ
1 الف ʾalef NS [ɒ] U+0627 บัญชีผู้ใช้นี้เป็นส่วนตัว อา
2 บาส เป็น NS [NS] U+0628 บบ บบ บาส บาส
3 วิชาพลศึกษา NS [NS] U+067E پ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
4 เต เต NS [NS] U+062A คอม คอม ตู่ เต
5 s̱e NS [NS] U+062B ث บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
6 จิม จิม NS [d͡ʒ] U+062C ญจ เจ๊ จัง
7 เช [t͡ʃ] U+0686 چ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
8 ฮะ ḥe ( ḥâ-ye ḥotti , ḥâ-ye jimi ) ชม [ชม] U+062D บัญชีผู้ใช้นี้เป็นส่วนตัว แมน ฮะ ฮะ
9 xe NS [NS] U+062E บบ เข้ خ
10 ดัล ดาล NS [NS] U+062F บัญชีผู้ใช้นี้เป็นส่วนตัว
11 ال ẕâl [z] U+0630 ذ
12 NS NS [NS] U+0631 อาร์
13 แห้ว เซ z [z] U+0632 แหนม แห้ว
14 เช่ ž [ʒ] U+0698 ژ
15 ซิ่น บาป NS [NS] U+0633 ซิส ซิส ซอส ซอส
16 ชีเน่ บาป NS [ʃ] U+0634 แหนม ـ ชอ ชะอุ ชะ
17 สหัส ṣâd NS [NS] U+0635 ـ แก้ ص
18 ดาด้า zâd . [z] U+0636 ญะ แอ๊ แอ๊ ض
19 طا NS [NS] U+0637 แอร๊ ครัว ครัว ط
20 ا ẓâ [z] U+0638 ظ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
21 عین ayn [ʔ] , [æ] U+0639 บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว ع . ع
22 ญิน ayn NS [ɢ] , [ɣ] U+063A غ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
23 ฟู่ เฟ NS [NS] U+0641 ـف บบ ฟอ ฟู่
24 กาฟา qâf NS [NS] U+0642 ควาย ถูกต้อง คั
25 คาฟ กาฟ k [k] U+06A9 คึ คุ๊ก คึ คัพ
26 گاف กาฟ NS [ɡ] U+06AF گ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว
27 ลาม ลาม l [ล] U+0644 ـ บบ ลา หลี่
28 มีม mim NS [NS] U+0645 คอม คอม เอ็ม มั
29 โนน แม่ชี NS [NS] U+0646 พังงา พังงา นั้
30 วาว vâv v / ū / ow / ( w / aw / ōใน Dari) [v] , [uː] , [o] (เฉพาะคำสุดท้าย), [ow] ( [w] , [aw] , [oː]ใน Dari) U+0648 ـ و
31 ฮะ เขา ( hā-ye havvaz , hā-ye do-češm ) ชม [h] , [e] (คำสุดท้าย) U+0647 ـ แมนๆ ฮา ฮะ
32 ใช่ y / ī / á / ( ay / ēในดารี) [j] , [i] , [ɒː] ( [aj] / [eː]ในดารี) U+06CC ـ

ในอดีตก็ยังมีตัวอักษรพิเศษสำหรับเสียง/ β / จดหมายฉบับนี้ไม่ได้ใช้เป็น / β / -sound เปลี่ยนไป / b / เช่นโบราณزڤان / zaβān /> زبان / zæbɒn / 'ภาษา' [6]

เสียง แบบฟอร์มแยก แบบฟอร์มสุดท้าย แบบฟอร์มตรงกลาง แบบฟอร์มเริ่มต้น ชื่อ
/β/ ڤ บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว เบต้า

รุ่นต่างๆ

ی ه و ن م ل گ ک ق ف غ ع ظ ط ض ص ش س ژ ز ر ذ د خ ح چ ج ث ت پ ب ا ء
Farsi in 16 fonts 2020-03-22 213757.png
แบบอักษร:
โนโต นาสตาลิก อูรดู
เชเฮราซาเด
Lateef
Noto Naskh อาราบิค
ข้อความ Markazi
Noto Sans อาราบิค
บาลู ไบจาน
เอล เมสซิรี เซมิโบลด์
น้ำมะนาวขนาดกลาง
ช้างมีเดียม
มาดา
โนโต คูฟี อาราบิค
รีม คูฟี
ลาเลซาร์
จอมฮูเรีย
รักกะส
ตัวอักษรใน 16 แบบอักษร: Noto Nastaliq Urdu, Scheherazade, Lateef, Noto Naskh Arabic, Markazi Text, Noto Sans Arabic, Baloo Bhaijaan, El Messiri SemiBold, Lemonada Medium, Changa Medium, Mada, Noto Kufi Arabic, Reem Kufi, Lalezar, Jomhuria , และรักคาส.

การสร้างจดหมาย

แบบฟอร์ม(i) โดดเดี่ยว  อา ปีที่แล้ว ฮะ ซอส ط ع คัพ หลี่ มั و ฮะ
เริ่ม อา บัญชีผู้ใช้นี้เป็นส่วนตัว ฮะ ซอส ص ครัว ع . บัญชีผู้ใช้นี้เป็นส่วนตัว คึ ลา เอ็ม و ฮา
กลาง บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว  แมน ซิส แก้ ครัว บัญชีผู้ใช้นี้เป็นส่วนตัว บัญชีผู้ใช้นี้เป็นส่วนตัว คุ๊ก บบ คอม บัญชีผู้ใช้นี้เป็นส่วนตัว อาร์ ـ แมนๆ
จบ บัญชีผู้ใช้นี้เป็นส่วนตัว ـ ں ٮ บัญชีผู้ใช้นี้เป็นส่วนตัว ซิส ـ แอร๊ บัญชีผู้ใช้นี้เป็นส่วนตัว ڡ ٯ คึ ـ คอม บัญชีผู้ใช้นี้เป็นส่วนตัว อาร์ ـ ـ
ฉันแยม(i)
Unicode 0621 . . 0627 . . 0649 . . 06BA . . 066E . . 062D . . 0633 . . 0635 . . 0637 . . 0639 . . 06A1 . . 066F . . 066F . . 0644 . . 0645 . . 062F . . 0631 . . 0648. . . 0647 . .
1 จุดด้านล่าง บาส จัง
Unicode เอฟบีบี3 . 0628 . . 062C . .
1 จุดด้านบน ض ฟู่ แห้ว
Unicode เอฟบีบี2 . 0646 . . 062E . .  0636 . . 0638 . . 063A . . 0641 . .  0630 . . 0632 . . 
2 จุดด้านล่าง(ii)
Unicode FBB5 . 06ซีซี. .
2 จุดด้านบน เต คั แฟ้ม
Unicode เอฟบีบี4. 062A. . 0642 . . 0629 . .
3 จุดด้านล่าง  
Unicode เอฟบีบี9 . เอฟบีบี7 . 067E . . 0686 . . 
3 จุดด้านบน ชะ  
Unicode เอฟบีบี6 . 062B . . 0634 . .   0698 . .
บรรทัดด้านบน        
Unicode 203E .    06เอเอฟ .      
ไม่มี อา ฮะ ซอส ط ع คัพ หลี่ มั   و ฮะ
Unicode 0621 . . 0627 . . 0649 . . 06BA . . 062D . . 0633 . . 0635 . . 0637 . . 0639 . . 066F . . 0644 . . 0645 . . 062F . . 0631 . . 0648. . . 0647 . .
maddaข้างบน          
Unicode 06E4 . 0653 . 0622 . .          
Hamzaด้านล่าง บัญชีผู้ใช้นี้เป็นส่วนตัว            
Unicode 0655 . 0625 . .          
Hamzaด้านบน บัญชีผู้ใช้นี้เป็นส่วนตัว อ้า ลิ้ง
Unicode 0674 .   0654 .  0623 . .  0626 . . 0624 . . 06C0 . .

^ผม. i'jamตัวอักษรออกเสียงเป็นตัวอย่างเท่านั้นในส่วน typesetting ตัวละครรวมกันในกลางของตารางที่มีการใช้

^ii. Persian Yē มีจุด 2 จุดด้านล่างในตำแหน่งเริ่มต้นและตรงกลางเท่านั้น อาหรับมาตรฐานรุ่นييييมักจะมี 2 จุดด้านล่าง

จดหมายที่ไม่เชื่อมโยงกับจดหมายต่อไปนี้

ตัวอักษรเจ็ดตัว ( و , ژ , ز , ر , ذ , د , ا ) ไม่เชื่อมต่อกับตัวอักษรต่อไปนี้ ไม่เหมือนกับตัวอักษรที่เหลือในตัวอักษร ตัวอักษรทั้งเจ็ดมีรูปแบบเดียวกันในตำแหน่งที่แยกออกมาและตำแหน่งเริ่มต้น และรูปแบบที่สองในตำแหน่งที่อยู่ตรงกลางและสุดท้าย ตัวอย่างเช่นเมื่อตัวอักษรا alefเป็นจุดเริ่มต้นของคำเช่นاینجا injâ ( "ที่นี่"), รูปแบบเดียวกันจะใช้เป็นในบางแห่งalefในกรณีของامروز emruz ("วันนี้") จดหมายر reใช้แบบฟอร์มสุดท้ายและจดหมายو vâvใช้รูปแบบโดดเดี่ยว แต่อยู่ตรงกลางของคำและزยังมีรูปแบบที่แยกออกมา แต่มันเกิดขึ้นที่ส่วนท้ายของคำ

บทประพันธ์

อักษรเปอร์เซียได้นำชุดย่อยของเครื่องหมายกำกับเสียงภาษาอาหรับมาใช้ : zebar / æ / ( fatḥahในภาษาอาหรับ), zir / e / ( kasrahในภาษาอาหรับ) และ piš / o / หรือ / o / ( ḍammahในภาษาอาหรับ ออกเสียงว่าzammeในภาษาเปอร์เซียตะวันตก ) tanwīne NASB / แอ่น /และšaddah ( ซ้ำ ) คำบรรยายภาษาอาหรับอื่นๆ อาจพบเห็นได้ในคำยืมภาษาอาหรับในภาษาเปอร์เซีย

สระเสียงสั้น

Of the four Arabic short vowels, the Persian language has adopted the following three. The last one, sukūn, has not been adopted.

Short vowels
(fully vocalized text)
Name
(in Persian)
Name
(transliterated)
Trans. Value
064E
◌َ
زبر
(فتحه)
zebar/zibar a Ir. /æ/; D. /a/
0650
◌ِ
زیر
(کسره)
zer/zir e /e/
064F
◌ُ
پیش
(ضمّه)
peš/piš o /o/

In Iranian Persian, none of these short vowels may be the initial or final grapheme in an isolated word, although they may appear in the final position as an inflection, when the word is part of a noun group. In a word that starts with a vowel, the first grapheme is a silent alef which carries the short vowel, e.g. اُمید (omid, meaning "hope"). In a word that ends with a vowel, letters ع‎, ه‎ and و respectively become the proxy letters for zebar, zir and piš, e.g. نو (now, meaning "new") or بسته (bast-e, meaning "package").

Tanvin (nunation)

Nunation (Persian: تنوین‎, tanvin) is the addition of one of three vowel diacritics to a noun or adjective to indicate that the word ends in an alveolar nasal sound without the addition of the letter nun.

Nunation
(fully vocalized text)
Name
(in Persian)
Name
(transliterated)
Notes
064B
َاً، ـاً، ءً
تنوین نَصْبْ Tanvine nasb
064D
ٍِ
تنوین جَرّ Tanvine jarr Never used in the Persian language.

Taught in Islamic nations to

complement Quran education.

064C
ٌ
تنوین رَفْعْ Tanvine rafʔ

Tašdid

Symbol Name
(in Persian)
Name
(transliteration)
0651
ّ
تشدید tašdid

Other characters

The following are not actual letters but different orthographical shapes for letters, a ligature in the case of the lâm alef. As to (hamza), it has only one graphic since it is never tied to a preceding or following letter. However, it is sometimes 'seated' on a vâv, ye or alef, and in that case, the seat behaves like an ordinary vâv, ye or alef respectively. Technically, hamza is not a letter but a diacritic.

Name Pronunciation IPA Unicode Final Medial Initial Stand-alone Notes
alef madde â [ɒ] U+0622 ـآ آ آ The final form is very rare and is freely replaced with ordinary alef.
he ye -eye or -eyeh [eje] U+06C0 ـۀ ۀ Validity of this form depends on region and dialect. Some may use the three-letter ـه‌ای combination instead.
lām alef [lɒ] U+0644 (lām) and U+0627 (alef) ـلا لا
kašida U+0640 ـ This is the medial character which connects other characters

Although at first glance, they may seem similar, there are many differences in the way the different languages use the alphabets. For example, similar words are written differently in Persian and Arabic, as they are used differently.

Novel letters

The Persian alphabet has four extra letters that are not in the Arabic alphabet: /p/, /t͡ʃ/ (ch in chair), /ʒ/ (s in measure), /ɡ/.

Sound Shape Unicode name Unicode code point
/p/ پ pe U+067E
/t͡ʃ/ (ch) چ če U+0686
/ʒ/ (zh) ژ že U+0698
/ɡ/ گ gâf U+06AF

Deviations from the Arabic script

Persian uses the Eastern Arabic numerals, but the shapes of the digits 'four' (۴), 'five' (۵), and 'six' (۶) are different from the shapes used in Arabic. All the digits also have different codepoints in Unicode:[7]

Name Persian Unicode Arabic Unicode
0 ۰ U+06F0 ٠ U+0660
1 ۱ U+06F1 ١ U+0661
2 ۲ U+06F2 ٢ U+0662
3 ۳ U+06F3 ٣ U+0663
4 ۴ U+06F4 ٤ U+0664
5 ۵ U+06F5 ٥ U+0665
6 ۶ U+06F6 ٦ U+0666
7 ۷ U+06F7 ٧ U+0667
8 ۸ U+06F8 ٨ U+0668
9 ۹ U+06F9 ٩ U+0669
ye ی U+06CC ي * U+064A
kāf ک U+06A9 ك U+0643

* However, the Arabic variant continues to be used in its traditional style in the Nile Valley, similarly as it is used in Persian and Ottoman Turkish.

Word boundaries

Typically, words are separated from each other by a space. Certain morphemes (such as the plural ending '-hâ'), however, are written without a space. On a computer, they are separated from the word using the zero-width non-joiner.

Cyrillic Persian alphabet in Tajikistan

As part of the "russification" of Central Asia, the Cyrillic script was introduced in the late 1930s.[8][9][10][11][12] The alphabet remained Cyrillic until the end of the 1980s with the disintegration of the Soviet Union. In 1989, with the growth in Tajik nationalism, a law was enacted declaring Tajik the state language. In addition, the law officially equated Tajik with Persian, placing the word Farsi (the endonym for the Persian language) after Tajik. The law also called for a gradual reintroduction of the Perso-Arabic alphabet.[13][14][15][16][17][18][19][20][21][22][23][24]

The Persian alphabet was introduced into education and public life, although the banning of the Islamic Renaissance Party in 1993 slowed adoption. In 1999, the word Farsi was removed from the state-language law, reverting the name to simply Tajik.[1] As of 2004 the de facto standard in use is the Tajik Cyrillic alphabet,[2] and as of 1996 only a very small part of the population can read the Persian alphabet.[3]

Proposed Latin alphabet

Anwar Wafi Hayat, Afghan writer and researcher, proposed new Latin alphabet in 2019, called Rumi script for Dari Persian spoken in Afghanistan. His research revealed the various reading and writing problems with the current Perso-Arabic script adding that the script has slowed down literacy acquisition and hiked the poverty rate. Based on his study, the new Rumi Persian alphabet will improve literacy acquisition and help in digitizing the Persian language and will also help the foreigner learners of Persian to learn this language easily and quickly.  The Rumi Persian alphabet contains 32 letters.[25]

No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Latin Aa Āā Bb Dd Ee Êê/Ɛ̇ɛ̇ Ff Gg Hh Ii Îî Jj Ĵĵ/J̈̇j̈̇ Kk Ll Mm Nn Oo Pp Qq
Arabic َ زبر ا، آ ب د ی غ ف گ ح ، ه ِ زېر ي ج ژ ک ل م ن و پ ق
No 21 22 23 24 25 26 27 28 29 30 31 32
Latin Rr Ss Šš/S̈̇s̈̇ Tt Kh kh Ch ch Uu Ūū Ww Yy Zz Ai ai
Arabic ر س ش ت خ چ ُ پیش وُ و ی ذ، ز، ظ ئ

Example of Persian text in Rumi Persian script.

Persian in Rūmi Script Persian in Arabic Script
S̈̇uārimā barādarî o bāhamî

Saādato nawāye sulhi dāyemî

شعار ما برادری و باهمی

سعادت و نوای صلح دایمی

Salāmo amno ittihādo yak dilî

Barāye kāfai milal barābari

سلام و امن و اتحاد و یک دلی

برای کافه ملل برابری

Khamūs̈̇ bād zanghāye janghā

Mabād zinda imtiyāzi rangha

خموش باد زنگهای جنگ ها

مباد زنده امتیاز رنگ ها

See also

References

  1. ^ Ira M. Lapidus (2012). Islamic Societies to the Nineteenth Century: A Global History. Cambridge University Press. pp. 256–. ISBN 978-0-521-51441-5.
  2. ^ Ira M. Lapidus (2002). A History of Islamic Societies. Cambridge University Press. pp. 127–. ISBN 978-0-521-77933-3.
  3. ^ Persian (Fārsī / فارسی), omniglot
  4. ^ "ویژگى‌هاى خطّ فارسى". Academy of Persian Language and Literature. Archived from the original on 2017-09-07. Retrieved 2017-08-05.
  5. ^ "??" (PDF). Persianacademy.ir. Archived from the original (PDF) on 2015-09-24. Retrieved 2015-09-05.
  6. ^ "PERSIAN LANGUAGE i. Early New Persian". Iranica Online. Retrieved 18 March 2019.
  7. ^ "Unicode Characters in the 'Number, Decimal Digit' Category".
  8. ^ ed. Hämmerle 2008, p. 76.
  9. ^ Cavendish 2006, p. 656.
  10. ^ Landau & Kellner-Heinkele 2001, p. 125.
  11. ^ ed. Buyers 2003, p. 132.
  12. ^ Borjian 2005.
  13. ^ ed. Ehteshami 2002, p. 219.
  14. ^ ed. Malik 1996, p. 274.
  15. ^ Banuazizi & Weiner 1994, p. 33.
  16. ^ Westerlund & Svanberg 1999, p. 186.
  17. ^ ed. Gillespie & Henry 1995, p. 172.
  18. ^ Badan 2001, p. 137.
  19. ^ Winrow 1995, p. 47.
  20. ^ Parsons 1993, p. 8.
  21. ^ RFE/RL, inc, RFE/RL Research Institute 1990, p. 22.
  22. ^ Middle East Institute (Washington, D.C.) 1990, p. 10.
  23. ^ Ochsenwald & Fisher 2010, p. 416.
  24. ^ Gall 2009, p. 785.
  25. ^ Hayat, Anwar (2019). "The Impact of Arabic Orthography on Literacy and Economic Development in Afghanistan".

External links