Skip to content

Instantly share code, notes, and snippets.

@son0nline
Created April 12, 2021 03:30
Show Gist options
  • Save son0nline/0670896325eb54c37cd1f410bfb969f0 to your computer and use it in GitHub Desktop.
Save son0nline/0670896325eb54c37cd1f410bfb969f0 to your computer and use it in GitHub Desktop.
js: bỏ dấu Tiếng Việt
function removeVietnameseChar(str, bRPunctuations) {
// Bỏ các khoảng trắng liền nhau
str = str.replace(/ + /g, " ");
str = str.trim();
// Bỏ dấu tiếng Việt
str = str.replace(/à|á|||ã|â||||||ă|||||/g, "a");
str = str.replace(/è|é||||ê||ế|||/g, "e");
str = str.replace(/ì|í|||ĩ/g, "i");
str = str.replace(/ò|ó|||õ|ô||||||ơ|||||/g, "o");
str = str.replace(/ù|ú|||ũ|ư|||||/g, "u");
str = str.replace(/|ý|||/g, "y");
str = str.replace(/đ/g, "d");
str = str.replace(/À|Á|||Ã|Â||||||Ă|||||/g, "A");
str = str.replace(/È|É||||Ê|||||/g, "E");
str = str.replace(/Ì|Í|||Ĩ/g, "I");
str = str.replace(/Ò|Ó|||Õ|Ô||||||Ơ|||||/g, "O");
str = str.replace(/Ù|Ú|||Ũ|Ư|||||/g, "U");
str = str.replace(/|Ý|||/g, "Y");
str = str.replace(/Đ/g, "D");
// Some system encode vietnamese combining accent as individual utf-8 characters
// Một vài bộ encode coi các dấu mũ, dấu chữ như một kí tự riêng biệt nên thêm hai dòng này
str = str.replace(/\u0300|\u0301|\u0303|\u0309|\u0323/g, ""); // ̀ ́ ̃ ̉ ̣ huyền, sắc, ngã, hỏi, nặng
str = str.replace(/\u02C6|\u0306|\u031B/g, ""); // ˆ ̆ ̛ Â, Ê, Ă, Ơ, Ư
// Remove punctuations
// Bỏ dấu câu, kí tự đặc biệt
if (bRPunctuations) {
str = str.replace(/!|@|%|\^|\*|\(|\)|\+|\=|\<|\>|\?|\/|,|\.|\:|\;|\'|\"|\&|\#|\[|\]|~|\$|_|`|-|{|}|\||\\/g, " ");
}
return str;
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment