UTF-8 поддерживает любой символ Unicode, который прагматически означает любой естественный язык (коптский, сингальский, Phonecian, Cherokee и т. Д.), А также многие неречевые языки (нотация музыки, математические символы, APL).
Заявленная цель консорциума Unicode - охватить все коммуникации. Несколько исключений, которые не поддерживаются должным образом (например, клингон), обычно имеют эквивалент латинского алфавита и / или имеют неофициальную частную кодовую страницу юникода.
Если вы беспокоитесь о конкретном языке, вам лучше спросить об этом конкретном и конкретном языке.
см. http://www.unicode.org/charts/index.html, где показаны все основные кодовые блоки (наборы символов), поддерживаемые юникодом. Обычно набор символов соответствует языковой семье, но соответствие не является однозначным.