Skip to content

Instantly share code, notes, and snippets.

@bunsyy
Created March 31, 2025 03:07
Show Gist options
  • Save bunsyy/8c03530841923919c4bf86025e35d543 to your computer and use it in GitHub Desktop.
Save bunsyy/8c03530841923919c4bf86025e35d543 to your computer and use it in GitHub Desktop.

Khmer Orthography

This section outlines the Khmer writing system, focusing on its series system and how phonemes correspond to graphemes. It covers consonants, clusters, and their pronunciation rules, drawing from historical and modern usage.

1. Series System

Khmer orthography uses a "series" system to determine syllable pronunciation, dividing consonants into two groups:

  • 1st Series (light voice): Higher pitch, e.g., ក (/k/).
  • 2nd Series (heavy voice): Lower pitch, e.g., គ (/k/).

Vowels change sound based on the series of the initial consonant. For example:

  • Vowel ា:
    • With ក (1st series): កា (/kaa/, "cup").
    • With គ (2nd series): គា (/kie/, proper noun).

In clusters, the least sonorous consonant sets the series (see Series Assimilation in the original document).


2. Phoneme-Grapheme Correspondence

Khmer characters map to phonemes, with variations based on position (initial, medial, final) and series. Below are key categories and examples.

2.1. Initial Consonants

2.1.1. Single Consonants

These 33 consonants form the basis of Khmer syllables, split by series:

Grapheme Phoneme Series Example
/k/ 1st កង់ (/kɑŋ/, "wheel")
/kʰ/ 1st ខុស (/khoh/, "wrong")
/k/ 2nd គោល (/kool/, "goal")
/kʰ/ 2nd ឃើញ (/kʰəəɲ/, "see")
/ŋ/ 2nd ង៉ា (/ŋaa/, "ivory")
/c/ 1st ចេក (/ceek/, "banana")
/cʰ/ 1st ឆាយ (/cʰaaj/, "sharpen")
/c/ 2nd ជាតិ (/ciet/, "nation")
/cʰ/ 2nd ឈឺ (/cʰɨə/, "sick")
/ɲ/ 2nd ញាក់ (/ɲeak/, "shake")
/ɗ/ 1st ដៃ (/ɗaj/, "hand")
/tʰ/ 1st ឋាន (/tʰaan/, "place")
/ɗ/ 2nd ឌី (/ɗii/, "D")
/tʰ/ 2nd ឍាន់ (/tʰaan/, "plate")
/n/ 1st ណាយ (/naaj/, "dragon")
/t/ 1st តែ (/tae/, "tea")
/tʰ/ 1st ថ្ងៃ (/tŋaj/, "day")
/t/ 2nd ទី (/tɨj/, "place")
/tʰ/ 2nd ធំ (/tʰum/, "big")
/n/ 2nd នឹក (/nɨk/, "miss")
/ɓ/ 1st បាយ (/ɓaaj/, "rice")
/pʰ/ 1st ផែ (/pʰae/, "raft")
/p/ 2nd ពែង (/pɛɛŋ/, "cup")
/pʰ/ 2nd ភ្លើង (/pʰləəŋ/, "fire")
/m/ 2nd មាន (/mien/, "have")
/j/ 2nd យល់ (/jul/, "understand")
/r/ 2nd រាល (/riel/, "spread")
/l/ 2nd លើ (/ləə/, "above")
/w/ 2nd វែង (/wɛɛŋ/, "long")
/s/ 1st សក់ (/sɑk/, "hair")
/h/ 1st ហ៊ាន (/haan/, "dare")
/l/ 1st ឡាន (/laan/, "car")
/ʔ/ 1st អាកាស (/ʔaakaah/, "sky")

2.2. Consonant Clusters

2.2.1. Word-Initial Clusters

Two-consonant clusters at the start of words include:

  • ក្ង, ក្ដ, ក្ត, ក្ន, ក្ប, ក្ម, ក្រ, ក្ល, ក្វ, ក្ស, ក្អ
  • ខ្ច, ខ្ញ, ខ្ត, ខ្ន, ខ្ព, ខ្ម, ខ្យ, ខ្ល, ខ្វ, ខ្ស
  • ច្ន, ច្ប, ច្យ, ច្រ
  • ឆ្ក, ឆ្ង, ឆ្ដ, ឆ្ន, ឆ្ប, ឆ្ម, ឆ្ល, ឆ្វ, ឆ្អ
  • ជ្វ, ណ្ហ
  • ត្ង, ត្ន, ត្ប, ត្ម, ត្រ, ត្ល, ត្វ, ត្អ
  • ថ្ក, ថ្ង, ថ្ដ, ថ្ន, ថ្ប, ថ្ម, ថ្ល, ថ្វ, ថ្យ
  • ន្រ, ន្អ
  • ប្ដ, ប្រ, ប្ល, ប្អ
  • ផ្ក, ផ្ង, ផ្ច, ផ្ញ, ផ្ដ, ផ្ត, ផ្ន, ផ្ប, ផ្ម, ផ្រ, ផ្ល, ផ្ស
  • ម្ក, ម្ខ, ម្ង, ម្ច, ម្ញ, ម្ដ, ម្ន, ម្ផ, ម្យ, ម្រ, ម្ល, ម្ស, ម្ហ, ម្អ
  • ល្ក, ល្ខ, ឲ្ង, ល្ប, ឲ្ព, ឲ្ម, ឲ្យ, ឲ្វ, ល្ហ, ឲ្អ
  • វ្ហ
  • ស្ក, ស្ង, ីញ, ី្ដ, ី្ត, ី្ថ, ី្ន, ី្ប, ី្ព, ី្ម, ី្រ, ី្ល, ី្វ, ី្អ
  • ហ្ន, ហ្ម, ហ្រ, ហ្ល, ហ្វ
  • អ្ង, អ្ន, អ្វ, អ្ហ

Examples:

  • ក្ងោក (/kŋook/, "peacock")
  • ក្តាម (/kɗaam/, "crab")
  • ច្នៃ (/cnaj/, "sew")
  • ប្រុស (/proh/, "man")

2.2.2. Word-Medial Clusters

Clusters within words (often loanwords):

  • ក្ក, ក្ខ, ក្គ, ក្ឃ, ក្ង, ក្ច, ក្ឆ, ក្ជ, ក្ឈ, ក្ញ, ក្ដ, ក្ត, ក្ឌ, ក្ឍ, ក្ន, ក្ប, ក្ផ, ក្ព, ក្ភ, ក្ម, ក្យ, ក្រ, ក្ល, ក្វ, ក្ស, ក្អ
  • ខ្ច, ខ្ញ, ខ្ត, ខ្ន, ខ្ព, ខ្ម, ខ្យ, ខ្ល, ខ្វ, ខ្ស
  • គ្ក, គ្ខ, គ្គ, គ្ឃ, គ្ង, គ្ច, គ្ឆ, គ្ជ, គ្ឈ, គ្ញ, គ្ដ, គ្ត, គ្ឌ, គ្ន, គ្ប, គ្ម, គ្យ, គ្រ, គ្ល, គ្វ, គ្ស
  • ឃ្ញ, ឃ្ន, ឃ្ម, ឃ្យ, ឃ្ល, ឃ្វ
  • ង្ក, ង្ខ, ង្គ, ង្ឃ, ង្ង, ង្ញ, ង្វ
  • ច្ច, ច្ឆ, ច្ជ, ច្ឈ, ច្ន, ច្ប, ច្យ, ច្រ, ច្វ
  • ឆ្ក, ឆ្ង, ឆ្ដ, ឆ្ន, ឆ្ប, ឆ្ម, ឆ្ល, ឆ្វ
  • ជ្ច, ជ្ឆ, ជ្ជ, ជ្ឈ, ជ្ន, ជ្យ, ជ្រ, ជ្វ
  • ឈ្ម, ឈ្ល
  • ញ្ច, ញ្ឆ, ញ្ជ, ញ្ឈ, ញ្ន, ញ្យ, ញ្រ
  • ដ្ដ, ដ្ត, ដ្ឋ
  • ឌ្ក, ឌ្ខ, ឌ្គ, ឌ្ឃ, ឌ្ន, ឌ្យ, ឌ្រ
  • ឍ្ន
  • ណ្ត, ណ្ន, ណ្ហ
  • ត្ត, ត្ថ, ត្ន, ត្ម, ត្យ, ត្រ, ត្ល, ត្វ, ត្ស
  • ថ្ក, ថ្ង, ថ្ន, ថ្ម, ថ្ល, ថ្វ
  • ទ្ក, ទ្ខ, ទ្គ, ទ្ឃ, ទ្ន, ទ្យ, ទ្រ, ទ្ល, ទ្វ
  • ធ្ន, ធ្យ, ធ្ល
  • ន្ត, ន្ទ, ន្ធ, ន្ន, ន្ម, ន្យ, ន្ល
  • ប្ត, ប្ន, ប្ប, ប្យ, ប្រ, ប្ល
  • ផ្ក, ផ្ន, ផ្ល, ផ្ស
  • ព្ត, ព្ទ, ព្ន, ព្យ, ព្រ, ព្ល
  • ភ្ន, ភ្ល
  • ម្ត, ម្ន, ម្ព, ម្យ, ម្រ, ម្ល, ម្ស, ម្ហ, ម្អ
  • យ្យ, រ្ត, រ្យ, រ្វ
  • ល្ក, ល្ខ, ល្ង, ល្ត, ឲ្ប, ឲ្ម, ឲ្យ, ឲ្វ, ឲ្ហ
  • វ្ត, វ្ន, វ្យ, វ្រ, វ្វ
  • ស្ត, ី្ន, ី្ប, ី្ម, ី្រ, ី្ល, ី្វ
  • ហ្ម, ហ្វ, ហ្អ
  • ឡ្អ
  • អ្ត, អ្ន, អ្យ, អ្រ, អ្វ, អ្ស, អ្ហ

Examples:

  • សុខភាព (/sok.pʰiep/, "health")
  • និស្សិត (/niʔ.sət/, "student")
  • ទឡ្ហីករណ៍ (/teaʔ.lhəj.kɑɑ/, "proof")

2.2.3. Word-Final Clusters

Typically Pali/Sanskrit loanwords:

  • ក្ក, ក្ខ, ក្ដ, ក្ត, ក្យ, ក្រ, ក្ស
  • ខ្យ
  • គ្គ, គ្ឃ, គ្ធ, គ្យ, គ្រ
  • ង្ក, ង្គ, ង្ឃ, ង្រ, ង្ស, ង្ហ
  • ច្ច, ច្ឆ
  • ជ្ជ, ជ្ឈ, ជ្ញ, ជ្យ, ជ្រ
  • ញ្ច, ញ្ញ
  • ដ្ដ, ដ្ឋ
  • ឌ្គ, ឌ្ឍ
  • ណ្ដ, ណ្ឌ, ណ្ណ, ណ្យ, ណ្ហ
  • ត្ត, ត្ថ, ត្ន, ត្ម, ត្យ, ត្រ, ត្វ, ត្ស
  • ថ្ម
  • ទ្ទ, ទ្ធ, ទ្ម, ទ្យ, ទ្រ
  • ធ្យ
  • ន្ត, ន្ថ, ន្ទ, �ន្ធ, ន្ន, ន្ម, ន្យ, ន្ល
  • ប្ត, ប្ន, ប្ប
  • ព្ទ, ព្ធ, ព្ភ, ព្យ, ព្វ
  • ភ្រ
  • ម្ព, ម្ភ, ម្ម, ម្យ, ម្រ, ម្ល, ម្ហ, ម្អ
  • យ្យ, រ្យ, រ្ស
  • ឲ្ក, ឲ្ង, ឲ្ប, ឲ្ម, ឲ្យ, ឲ្ល
  • ី្ក, ី្ដ, ី្ឋ, ី្ថ, ី្ន, ី្ប, ី្ម, ី្ស
  • ហ្ម, ឡ្ហ

Examples:

  • ទុក្ខ (/tuk/, "suffering")
  • ពាក្យ (/peak/, "word")
  • វគ្គ (/wok/, "section")
  • កសិកម្ម (/kaʔ.siʔ.kam/, "agriculture")

2.2.4. Three-Consonant Clusters

Clusters with two subscripts:

  • ស្ត្រ, ហ្វ្រ
  • ក្ស្ម, ង្ក្រ, ង្ខ្យ, ង្គ្ល, ង្គ្រ, ង្ឃ្រ, ញ្ច្រ, ញ្ជ្រ, ដ្ឋ្យ, ន្ត្រ, ន្ទ្រ, ន្ធ្យ, ី្គ្វ
  • ក្ត្រ

Examples:

  • ស្ត្រី (/strəj/, "woman")
  • ហ្វ្រ័ង (/fraŋ/, "brake")
  • បង្ក្រាប (/ɓɑŋ.kraap/, "defeat")

2.2.5. Initial Clusters in Both Series

Pairs across 1st and 2nd series (some with shifters like ៉ or ៊):

  • ក្ង, គ្ង, ក្ដ, ក្ឌ, គ្ឌ, ក្ត, ក្ទ, ក្ន, គ្ន, ក្ប, គ្ប, ក្ម, គ្ម, ក្រ, គ្រ, ក្ល, គ្ល, ក្វ, គ្វ, ក្ស, គ្ស, ក្អ, គ្អ
  • ខ្ច, ខ្ជ, ខ្ញ, ឃ្ញ, ខ្ត, ខ្ទ, ខ្ន, ឃ្ន, ខ្ព, ឃ្ព, ខ្ម, ឃ្ម, ខ្យ, ឃ្យ, ខ្ល, ឃ្ល, ខ្វ, ឃ្វ, ខ្ស, ឃ្ស
  • ច្ន, ឈ្ន, ច្ប, ជ្ប, ច្យ, ជ្យ, ច្រ, ជ្រ
  • ឆ្ក, ឆ្គ, ឆ្ង, ឈ្ង, ឆ្ដ, ឆ្ឌ, ឆ្ន, ឆ្ប, ឆ្ព, ឆ្ម, ឈ្ម, ឆ្ល, ឈ្ល, ឆ្វ, ឈ្វ, ឆ្អ, ឈ្អ
  • ច្វ, ជ្វ
  • ណ្ហ
  • ត្ង, ទ្ង, ត្ន, ទ្ន, ត្ប, ទ្ប, ត្ម, ទ្ម, ត្រ, ទ្រ, ត្ល, ទ្ល, ត្វ, ទ្វ, ត្អ, ទ្អ
  • ថ្ក, ថ្គ, ថ្ង, ធ្ង, ថ្ដ, ធ្ឌ, ថ្ឌ, ថ្ន, ធ្ន, ថ្ប, ថ្ព, ថ្ម, ធ្ម, ថ្ល, ធ្ល, ថ្វ, ធ្វ, ថ្យ, ធ្យ
  • ន្រ
  • ប្ដ, ប្ឌ, ប្រ, ព្រ, ប្ល, ព្ល, ប្អ
  • ផ្ក, ផ្គ, ផ្ង, ភ្ង, ផ្ច, ភ្ជ, ផ្ញ, ភ្ញ, ផ្ដ, ភ្ឌ, ផ្ត, ផ្ទ, ផ្ន, ភ្ន, ផ្ប, ផ្ម, ភ្ម, ផ្រ, ភ្រ, ផ្ល, ភ្ល, ផ្ស, ភ្ស, ផ្អ, ភ្អ
  • ព្ក, ព្គ, ព្ន, ព្យ, ព្ល, ព្អ
  • ម្ក, ម្គ, ម្ខ, ម្ឃ, ម្ង, ម្ច, ម្ជ, ម្ញ, ម្ដ, ម្ឌ, ម្ន, ម្ផ, ម្ភ, ម្យ, ម្រ, ម្ល, ម្ស, ម្ហ, ម្អ
  • ឲ្ក, ឲ្គ, ឲ្ខ, ឲ្ឃ, ឲ្ង, ឲ្ប, ឲ្ព, ឲ្ម, ឲ្យ, ឲ្វ, ឲ្ហ, ឲ្អ
  • វ្ហ
  • ី្ក, ី្គ, ី្ង, ីញ, ី្ដ, ី្ឌ, ី្ត, ី្ទ, ី្ថ, ី្ធ, ី្ន, ី្ប, ី្ព, ី្ម, ី្រ, ី្ល, ី្វ, ី្អ
  • ហ្ន, ហ្ម, ហ្រ, ហ្ល, ហ្វ
  • អ្ង, អ្ន, អ្វ, អ្ហ

Notes

  • Series Impact: Pronunciation depends on the series of the initial consonant or cluster.
  • Loanwords: Pali, Sanskrit, and modern languages (e.g., French) influence cluster usage.
  • Rendering: Digital rendering requires correct encoding order (consonant-vowel-diacritic).

For detailed charts, refer to the original document’s appendices.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment