Editar: a pergunta agora diz "milhões de novos caracteres". Isso facilita a resposta:
Não . Utf-8 é uma codificação Unicode. Unicode tem um espaço de código que permite 1,114,112 pontos de código distintos , e menos de um milhão está atualmente não atribuído. Portanto, não é possível suportar milhões de novos caracteres no Unicode. Por definição, nenhuma codificação Unicode pode suportar mais caracteres do que o definido pelo Unicode. (Claro que você pode trapacear codificando um nível a mais - qualquer tipo de dado pode ser representado por apenas dois caracteres).
Para responder à pergunta original:
O Unicode não suporta idiomas como tal, ele suporta caracteres - símbolos usados para representar o idioma em forma escrita.
Nem todas as linguagens humanas têm uma representação escrita, portanto nem todas as linguagens humanas podem ser suportadas pelo Unicode. Além disso, muitos animais se comunicam, mas não possuem uma linguagem escrita. As baleias, por exemplo, têm uma forma de comunicação que é complexa o suficiente para chamar uma língua, mas não tem nenhuma forma escrita (e também não pode ser capturada pela notação fonética existente). Portanto, nem todos os idiomas do mundo podem ser suportados pelo Unicode.
Ainda pior é algo como a linguagem das abelhas. Não só não tem uma forma escrita, como não pode ser representada de forma significativa em forma escrita. A linguagem é um tipo de dança que basicamente aponta em uma direção, mas depende da posição atual do sol. Portanto, a dança só tem valor informativo no lugar e hora em que é realizada. Uma representação simbólica ou textual teria que incluir informações (localização, posição do sol) que a linguagem das abelhas atualmente não pode expressar.
Mesmo uma forma de comunicação escrita ou simbólica pode não ser possível representar em Unicode. Por exemplo, ilustrações ou quadrinhos sem palavras não podem ser suportados pelo Unicode, pois o conjunto de glifos não é finito. Você notará muita comunicação pictórica em ambientes internacionais como um aeroporto, por isso não é inconcebível que uma raça de alienígenas viajando pelo espaço tenha evoluído para usar uma linguagem pictórica.
Mesmo que uma raça alienígena tenha uma linguagem com um sistema de escrita com um conjunto finito de símbolos, talvez não seja possível suportar esse sistema no Unicode. O Unicode espera que a escrita seja uma seqüência linear de símbolos. A notação musical é um exemplo de um sistema de escrita que não pode ser totalmente representado no Unicode, porque o significado é codificado tanto na escolha dos símbolos quanto no posicionamento vertical e horizontal. (Unicode suporta símbolos musicais individuais, mas não pode codificar uma partitura.) Uma raça alienígena que se comunicava usando música polifônica (não incomum) ou um canal de comunicação de complexidade similar, poderia muito bem ter um sistema de escrita parecendo uma partitura orquestral, e O Unicode não pode suportar isso.
Mas vamos admitir, por uma questão de argumento, que todas as linguagens, mesmo as línguas alienígenas, podem ser expressas como uma sequência linear de símbolos selecionados a partir de um conjunto finito. O Unicode é grande o suficiente para uma invasão alienígena? Unicode tem atualmente menos de um milhão de pontos de código não atribuídos. O idioma chinês contém cem mil caracteres de acordo com o dicionário chinês mais abrangente (nem todos são atualmente suportados pelo Unicode como caracteres distintos). Portanto, apenas dez idiomas com a complexidade do chinês usariam todo o Unicode. Na Terra, temos centenas de sistemas de escrita distintos, mas, felizmente, a maioria é alfabética em vez de ideográfica e, portanto, contém um pequeno número de caracteres. Se todas as linguagens escritas usassem ideogramas como o chinês, o Unicode nem seria grande o suficiente para a Terra. O uso de alfabetos é derivado da fala, que usa apenas um número limitado de fonemas, mas isso é particular para a fisiologia humana. Assim, mesmo um único planeta alienígena com apenas uma dúzia de sistemas de escrita ideográficos pode exceder o que o Unicode pode suportar. Agora, considere se esse alien já invadiu outros planetas antes da Terra e incluiu seus sistemas de escrita no conjunto de caracteres que precisam ser suportados.
A expansão ou modificação das codificações atuais ou a introdução de novas codificações não resolverão isso, já que a limitação está no número de pontos de código suportados pelo Unicode.
Então a resposta é provavelmente não.