Les nombres jusqu'à la dizaine


[Pour un bon affichage de cette page, vous devez avoir déclaré Unicode UTF-8 dans votre navigateur. La page contient des caractères spéciaux latins, roumains.]
Les nombres ! Voilà un beau sujet de dispute... Mais pourquoi et comment se forment-ils ? D'où viennent-ils ? Voici quelques éléments de réponse. La page est fort longue, les quatre colonnes correspondent aux divers faits suivants :

– Les formes latines : origines en indo-européen, rapprochements avec d'autres langues IE, évolution antique, quelques avatars modernes mais rarement.
– Les autres formes romanes : cette colonne fournit des éléments pour juger de l'évolution depuis le latin. Quelques remarques adventices concernent les évolutions particulières comme celle du roumain.
–  Du roman au français : cette partie est plus proprement phonétique et morphologique. L'évolution historique des formes est envisagée jusqu'à la fin du Moyen Âge, mais cette partie phonétique est parfois prolongée jusqu'en français contemporain si le phénomène le demande.
– Les formes modernes : cette partie est plus consacrée aux graphies depuis l'ancien français, mais surtout le français classique. Elle porte parfois sur les formes régionales ou des prononciations contemporaines.
 

   II    III    IV    V    VI    VII    VIII    IX

 
Les formes latines Les autres formes romanes Du roman au français Les formes modernes
I   unus

Le nombre I est fort riche dans les langues indo-européennes. Le grec a une racine *sem- dans en (neutre), *sem-s dans eis (masculin) qui alternait avec une forme *sm (grec mia, féminin). Cette racine se retrouve dans certains dérivés latins comme sim-ilis (semblable), sim-ul (ensemble), sem-el (une fois), sin-guli (seul), sim-plus(simple), sim-plex (simple). Comme on le voit, le nombre un est bien présent et pas du tout singulier !

Le thème de unus est dit occidental, il se rattache à une autre racine : *oi-no qui se retrouve en latin archaïque dans  oinus, en ombrien dans enom, en gothique dans ains, en grec dans oinè (forme unique), en sanscrit dans enas.

Cette forme devient ensuite un article défini comme dans d'autres langues européennes. Le diminutif ūllus issu de *oino-los a en outre survécu sous la forme de son négatif nūllus provenant de non-ūllus. La quantité vide existait en latin, mais c'est une création tardive, dérivée et qui procédait d'abord de un au sens de
« pas  un ».

La déclinaison de ce mot en -us, -a, -um a été influencée par celle de solus pronominal. Le génitif et le datif ont donc été en uniūs, unī. Le pluriel exceptionnel uni, unæ, una a été employé. Ce pluriel avait un sens collectif (un seul camp, une seule ville). 
 

  • Un : de l'indo-européen *oinos, "seul, unique".

    A évidemment donné tous les mots en uni- : union, unité, univers (en conjonction avec la famille de vers)... ainsi que les importants mots non (*ne oinom) et nul (*ne oinolos).

    La racine indo-européenne pour "un", *sem- , a donné en grec hemi- ("un seul" devenu "moitié", avec son équivalent latin semi-), homos ("semblable"), homalos ("régulier"), d'où anômalia ("irrégularité"), et est donc à l'origine de nombreux mots composés. Par l'intermédiaire du latin, on a obtenu semblable, ensemble, assemblée, assimiler, simuler, simultané, simple, singulier, sincère, et aussi sanglier (singularis porcus, "porc solitaire"). En anglais : same, some, en allemand : zusammen.

    Le grec monos, "seul", a une origine différente. Outre les nombreux composés desquels il est le préfixe, il subsiste dans le mot moine (solitaire) et ses dérivés.



cat. : u 
cor. : unu 
esp. : uno 
it. : uno 
oc. : un (M), uno (F) port. : um 
rom. :  in 
rou. : unu 

La consonne n se sonorise en m en portugais avant de se réduire. 

 

Parmi les adjectifs numéraux, un est le seul à avoir conservé les flexions de genre alors que vingt et cent ont pris des marques du pluriel. L'évolution part de l'accusatif : unum, unam. Le -m chute à la fin de l'époque républicaine. Le passage de u latin (voyelle postérieure, arrondie, fermée) à ü (voyelle antérieure, arrondie, fermée) a pu s'effectuer dès le Ier s. ap. J.-C. Cette voyelle serait une particularité gauloise qui a eu aussi son influence dans les dialectes italiens du Nord. La voyelle finale du masculin après un passage par une voyelle plus ouverte et centrale o s'est amuïe avant la fin de l'époque romane. Au féminin, la voyelle finale s'affaiblit en un e caduc. La nasalisation de la voyelle n'intervient que tardivement, au XIVe s., les voyelles les plus fermées n'ont été affectées qu'après les voyelles ouvertes. La dénasalisation intervient au XVIe s. Elle efface le timbre nasal au féminin et elle provoque l'apocope de la consonne au masculin sauf en cas de liaison.  L'ancien français déclinait l'adjectif numéral comme l'adjectif indéfini. La forme médiévale uns peut correspondre à un cas sujet singulier comme à un cas régime pluriel, notre pluriel actuel. La graphie ung a été employée à la Renaissance pour deux raisons. Elle apparaît en fait dès le
XIVe s. D'une part, le graphème g est une lettre diacritique qui assure la lisibilité d'un texte. Les jambages pouvaient faire confondre la graphie vn (en lettres non ramistes) avec le chiffre sept écrit en minuscules romaines vii. D'autre part, la graphie avec g est une marque de nasalité qui se retrouve par analogie avec d'autres mots où la lettre est faussement étymologique (compaing, poing, tesmoing). Cette forme avec g se retrouvait aussi dans le féminin ugne, voire ungne. Nicot proteste dès 1606 contre cette lettre abusive et l'Académie entérine en 1694 l'orthographe moderne. 

L'instabilité de la voyelle nasale, rare, explique qu'elle soit encore aujourd'hui attirée vers une plus grande ouverture. Les prononciations in existaient déjà au XIXe s. régionalement, en Bourgogne, Champagne, Picardie, tout comme on en Wallonie. 

Un autre fait important concerne la disjonction expressive de un. Elle n'est pas motivée par un h faussement étymologique comme dans huit. Nous avons affaire à un monosyllabe qui est parfois émit isolément avec le coup de glotte et non avec une aspiration. La disjonction a une valeur distinctive, mais elle demeure assez récente comme le montre la construction de l'indéfini l'un. Elle a contaminé aussi les formes liées à onze, nombre dérivé. Voir la page consacrée à l'élision. Voir la page consacrée à onze

II   duos

Le radical de deux est encore plus riche que celui d'un ! La base indo-européenne *dwi- a donné en latin à la fois bi- (sous la forme dvis chez Cicéron) et di-, on la retrouve encore dans le dérivé vingt (deux-dix). On retrouve encore ce thème simplifié dans du-plex, duo-décimal.

Mais il existait aussi un autre numéral à côté ! Ce numéral ambō avait une valeur synthétique (tous les deux ensemble, simultanément). Il sert à nos dérivés en ambi- : ambigu, ambivalent. Toutefois, il a encore été présent en ancien français sous les formes ambesas (deux as), ambedous (les deux ensemble par redondance), ambe en termes de jeu avec un -s de cas sujet analogique pris comme un pluriel à tort. Ce numéral suivait la déclinaison de duo.

La forme *dŭō provient de l'indo-européen dow-ō, rattaché au grec dúô, mais le latin l'a abrégé en duŏ au nominatif et à l'accusatif.  Il a renoncé au duel encore présent dans ambo.

  • Deux : indo-européen *duwo- , dwi- .

    On le trouve évidemment dans deux, double, dans les composés en di- (dichotomie), bi- avec ses variantes bin- (binocle) et vi- (vingt), diplo- (Diplodocus), dans duel (grammatical), dualité. Il a aussi laissé douter (au sens d'"hésiter entre deux possibilités") et dubitatif, redouter, ainsi que combiner et ses dérivés, ou enfin diplôme ("feuille pliée en deux").

    Le préfixe est parfois méconnaissable : une brouette a deux roues, et la balance deux plateaux, qui servent au figuré à dresser un bilan.

    L'expression de la dualité par amphi- ou ambi- résulte de l'utilisation de la racine *amb- , "autour", qui a aussi donné aller (latin ambulare).


cat. : dos, dues 
cor. : dui 
esp. : dos 
it. : due 
oc. : dous (M), dos (F) 
port. : dois 
rom. : dus 
rou. : doi 

L'occitan conserve une forme héritée de la diphtongaison au masculin. Le féminin repose sur l'assimilation du a au o

La forme roumaine postule l'emploi d'un nominatif là où le français a privilégié l'accusatif. C'est aussi le cas pour III. 

Il faut remonter à l'accusatif masculin de duo : duos. La forme unique de nombre en latin montre en fait une déclinaison au pluriel sur les modèles de la deuxième classe. La consonne finale ne subit pas d'apocope car elle est sentie comme une marque de pluriel, d'autant que le mot se décline encore en ancien français. Elle  se maintiendra jusqu'à l'époque de la Renaissance qui fait chuter les consonnes finales comme -s, justement au pluriel ou dans les conjugaisons. Les graphies médiévales deus, dous résultent de l'évolution de o long tonique libre. La voyelle diphtongue au VIe s. Le passage à la diphtongue eu se fait avant le XIIe s., sa réduction se faisant avant l'époque classique. L'ancien français déclinait l'adjectif : il était dui ou doi au cas sujet. L'ancien occitan avait aussi maintenu ce système : dui au sujet, dos au régime (doas au féminin au sujet). Ce nominatif dui par analogie est attesté au
IIIe s., tout comme le féminin duae, duas et le neutre duo. Il a existé en outre un féminin dues dans les textes bourguignons et champenois, forme régulièrement issue de duas

La forme romane duos (980) montre une conservation de la première voyelle assez tardivement. Elle est assimilée ensuite par la diphtongue. 

La graphie avec x (1549) est en fait d'origine médiévale, elle permet d'éviter la confusion avec Dieu écrit encore devs comme le nombre. Ensuite, cette forme est analogique de six où l'x est étymologique, cet x s'est aussi transmis à dix. L'ordinal deuxième, d'abord deuzeime, a suivi le même paradigme que sixième et dixième, par rattachement à la famille. 

III   tres

Le nominatif trēs vient d'un thème *trey-es. Il correspond au grec tréis et au sanscrit tráy-ah. Le neutre triā repose sur un thème réduit. Ce thème est à l'origine des formes comme tri-ceps.

  • Trois : indo-européen *ter.

    Se reconnaît dans tiers, tiercé, tercet, ternaire, triade, trinité, triple.

    Aussi à l'origine de trancher ("couper en trois", cf. écarter et esquinter), de trèfle (plante trifoliée), de troïka ("attelage de trois chevaux"), et de trivial.

    Enfin, il est envisageable que s'y rattache la famille de tribu, tribunal...

cat. : tres 
cor. : tre 
esp. : tres 
it. : tre 
oc. : tres 
port. : tres 
rom. : treis 
rou. : trei
En latin, l'accusatif et le nominatif de III étaient identiques : trēs. Cette forme valait aussi pour le masculin et le féminin. Ce fait explique que le mot ne se soit pas décliné en ancien français, ni qu'il ait conservé des marques de genre. Cependant, il a existé au XIIIe s. une forme comme li troi, cas sujet pluriel (li troi serjant l'enmainent) évident qui s'oppose à trois au cas régime dans le même texte. Cette forme est analogique du type bon, bons

Par contamination, III a fait perdre aussi à II sa déclinaison et ses genres. L'évolution du mot est ordinaire : e long tonique libre diphtongue en ei au
VIe s. dans le nord de la France. Cette diphtongue évolue vers oi puis vers entre le XIIe s. et le XIIIe s. On a affaire à un mot comme moi, roi, croire

L's s'est maintenue à l'oral jusqu'à l'époque classique. 

Il existait aussi en ancien occitan une déclinaison de III :  trei au cas sujet, tres au cas régime. Le cas sujet est analogique. 

Le maintien de l's répond à de nombreux motifs. Le mot est senti comme un pluriel, tout comme deux, six, dix. Par contamination, ces terminaisons affectent aujourd'hui la graphie de quatre (quatres), neuf (neufs) dans les écrits relâchés. Ensuite, la sifflante est restée longtemps présente à l'oral et elle se maintient en liaison –  ce qui est un fait imposé par les constructions nominales. 

Le fait moderne le plus marquant est le passage de à wa. Ce sera entériné avec la Révolution française. Au XVIe s. pourtant, Théodore de Bèze se plaint que les Parisiens prononcent à tort troas ou tras ; la prononciation regardée comme bonne était alors trouè.

IV   quattuor

Le nominatif indo-européen kwetwer-es se retrouve en grec téttares, en sanscrit catvārah. La production de la voyelle ǎ est un phénomène qui se produit en latin de manière populaire et qui est indépendant des autres évolutions de l'indo-européen, cette voyelle remplace les voyelles indo-européennes plus centrales o et e. Or, si l'influence de quatre est énorme déjà sur un, deux, trois, la présence de la voyelle va influencer aussi toutes les terminaisons de XL à XC en -ante. Cette voyelle mal expliquée possède une riche descendance ! 

Il faut noter que la racine gauloise est passée de kw à p et que le fait pourrait passer inaperçu (plus d'explications en V). Mais le qu- latin donne un p dans les langues celtiques britonniques et continentale. Cela explique les noms Périgord (petru-decamato, les quatre armées), Preuil (les quatre clairières), Pérolet (les quatre clairières). Les noms propres apparentés à Pierre (Petrus) ne dérivent pas forcément de la pierre (petra), mais sans doute de l'ordinal sous sa forme gallo-romaine, Quatrus dit *Petro.

Quatre : indo-européen *kwetwor.

Probablement le plus fécond. En grec, tessares ou tettares, qui a donné les composés formés sur tétra- (par exemple tétrapilectomie, qui consiste à couper les cheveux en quatre). En latin, quattuor et ses dérivés a donné les mots en quadr- (quadrature, quadrupède...) et quatr- (quatrain...).

Écarter, écarteler, écarquiller signifient "couper en quatre". On obtient alors des quartiers.

Les carrés, les carreaux, le carrelage, les squares ont quatre côtés, de même que le cadre. On les dessine avec une équerre. On équarrit ("tailler en carrés") dans les carrières. Les escadres, escouades et autres sont formées en carré.

De manière moins évidente, le carillon est un groupe de quatre cloches. La caserne regroupait à l'origine quatre personnes (et aujourd'hui encore, on peut en utiliser quartier comme synonyme). L'incartade est un coup d'épée donné en faisant un quart de tour. Le cahier et le carnet sont des feuilles pliées en quatre (ou des groupes de quatre feuilles).

cat. : quatre 
cor. : quàtru 
esp. : quatro 
it. : quattro 
oc. : quatre 
port. : quatro 
rom. : quater 
rou. : patru 

Le romanche a conservé la voyelle finale a sa place contrairement aux autres langues néo-latines. Ce fait s'explique par le caractère conservateur de cet isolat. 

La forme en p du roumain est analogique d'autres transformations de qu latin en p devant a, mais à l'intervocalique.

Voici le premier ordinal non décliné ! En apparence... Le latin quattuor était cependant un adjectif décliné, mais il y a eu convergence des
formes : quattuor(e)s passant à quattuorr, puis à quattuor par assimilation progressive. Par un jeu de dominos, la forme de V (quinque, invariable comme la suite) a affecté IV (quattuor), qui lui-même a influencé III (tres) malgré quelques tentatives de réfection casuelle, et enfin II (duo), ce qui se prolonge encore en français dans les composés de I (unus) comme aucun qui possèdent un pluriel. Nous tenons le bon bout de cette réduction des flexions. 

Il convient de partir de la forme quattor attestée par l'épigraphie. La métathèse de la voyelle finale est pan-romane. Elle n'a pas pu se produire après le IIIe s. en Dacie comme le montre la forme roumaine. 

La voyelle initiale est entravée, elle ne subit pas de diphtongaison. La réduction de la labiale qu latine à k devant a est un fait français roman comme en témoigne l'ancien occitan catre. À l'initiale, kwa se réduit à la vélaire suivie de la voyelle.

Le terme n'a pas subi de graphies avec c ou k en français. La graphie quatre apparaît dès 980. 

Il convient de noter la déformation moderne en quatres. Cette forme s'explique par l'attraction des autres numéraux qui semblent pluriel (deux, trois, six, dix). En outre, la prononciation avec apocope du r est fréquente, régionale, populaire. Cela explique les constructions comme entre quat'-z-yeux ou le Bal des Quat'-z-Arts. Le passage de l'alvéolaire liquide r à l'alvéolaire spirante z est normal. 

V   quinque

L'indo-européen possédait une forme invariable *pwenkwe. Cette forme se retrouve encore dans le mot Pendjab, dans le nom punch (des cinq fleuves, issu du bengali). La racine grecque penta- se rattache plus directement à ce thème. Il y a eu assimilation ancienne en latin et perte de la labialité, la finale a influencé sur l'initiale et a modifié son articulation. Le gaulois a, en revanche, développé une forme avec p initial comme le grec et le sanscrit.  Cette forme est propre au gaulois, au celtique britonnique, mais non au celtique gaélique qui maintient la vélaire k. Le mot suit jusqu'à ce moment une évolution similaire de de celle de IV, quatre.

L'évolution de la séquence initiale qu en k, avec la forme vulgaire cinque, résulte de la dissimilation qui s'était déjà opérée en latin, avec le passage de kw en kw.

 Cinq : indo-européen *penkwe. En grec pente utilisé comme préfixe. Il y a peu de mots ou sa présence n'est pas transparente : esquinter ("couper en cinq"), ou bien quinconce ("disposition des points sur les pièces de cinq onces") ; punch, boisson d'origine indienne, comprenant cinq ingrédients, d'après l'hindi panch "cinq" ; Pendjab ("cinq rivières"), et par conséquent Pakistan

cat.: cinc 
cor. : cinque 
esp. : cinco 
it. : cinque 
oc. : cinc 
port. : cinco 
rom. : tschun 
rou. : cinci 

L'absence de la voyelle finale est évidente en français, occitan, catalan. Ce groupe central a produit des apocopes à date précoce, en roman, mais ce n'est pas présent partout, la forme quatre montre une conservation du fait de la métathèse et d'une séquence tr appuyée. 
 

Le mot s'est d'abord écrit cinc (1080). L'étymon latin a subi une fausse palatalisation devant i, ce fait est pan-roman et date d'avant le IIIe s. comme le montre la forme roumaine. Yod initial produit un groupe ky qui devient ty puis qui se mue en affriquée avant le Ve s. 

La voyelle finale s'amuït en position absolue. La voyelle initiale, qui est entravée, ne subit pas de diphtongaison. Sa nasalisation intervient au XIIIe s., sa dénasalisation au XVIe s. La chute de la finale sauf en liaison est de l'époque classique. 

La graphie cinq avec la consonne finale est une graphie étymologique, elle présente la particularité d'offrir un q sans u en finale, comme dans coq et certains noms propres. 

Le rétablissement de la prononciation de la consonne finale à l'oral est un fait moderne, depuis le XVIIIe s. Il est comparable à celui des finales en -k (bec, bouc) ou en t (vingt). L'influence de l'orthographe existe, mais il y a aussi une volonté discriminatoire afin d'éviter les homonymies. La consonne ne se prononce pas, selon la norme, devant une autre consonne. Le nom de Cinq-Mars (comme saint mar) en témoigne. La prononciation cinq cents comme cinq cents est considérée comme relâchée.

VI   sex

La forme remonte à un indo-européen *sweks qui se prouve avec le crétois sFex (f = digamma, notant un son ). La forme grecque hexa en dérive, mais elle montre une faiblesse de l'initiale compensée par l'esprit rude. Le cardinal apparaît aussi en celtibère sues. Les formes celtiques ont conservé la consonne w (gallois, chwech). Le nom de la ville de Soissons, issu de la tribu des Suessiones, peut dériver de cet adjectif tout comme dans le cas du Périgord qui vient de quatre. 

Il n'y a eu altération phonétique que dans se-mestre et les dérivés latins avec consonne.

Six (indo-européen *seks) nous a laissé la sieste (à la sixième heure dans le système romain) et les années bissextiles.

cat. : sis 
cor. : sei 
esp. : seis 
it. : sei 
oc. : sièis 
port. seis 
rom. : sis 
rou. : şase 

La forme roumaine est originale : elle suppose qu'il y a eu production d'un i proche de e en
finale : *sex-i. Ce i analogique a pu ensuite contaminer la voyelle initiale en l'ouvrant par dissimilation, avant de passer lui-même à e, comme dans l'autre forme şapte (VII). On a là un exemple de tentative de réfection d'un système avec l'ajoute d'un affixe.

D'abord écrit sis (1080), puis six (XIIIe s.). L'assimilation régressive de la consonne k par s dans le groupe ks est pan-romane. 

Le passage de e long tonique entravé à un i en français est obscur, il ne répond pas aux évolutions attendues. La voyelle a dû subir l'influence d'un k suivi de consonne qui se palatalise et qui dégage un yod : seks > seys. D'évidence, il y a eu une diphtongaison dans l'ensemble de la Romania, mais pas avant le IIIe s. car la forme roumaine part directement de la forme latine classique et suit une évolution normale. Cette diphtongaison s'est produite avant le VIIe s. comme l'atteste la forme romanche. Or, on a là une forme qui témoigne d'une évolution ancienne. 

Ensuite, on peut postuler en français une assimilation progressive du premier élément de la diphtongue au deuxième, tandis qu'il se produit une dissimilation en occitan avec production d'un yod antérieur dû à la longueur de la diphtongue.

La graphie six est étymologique et savante. La lettre x valait pour s et elle vaut encore comme telle régionalement. Cette terminaison a déterminé deux et dix. Le graphème x rappelle à la fois le c de decem et le s de deux, il est encore senti comme marque de pluriel. Notons que l'hésitation a existé pour le sixain qui fut aussi sisain, sizain

Du temps de Littré, six se prononçait si sauf dans certaines conditions : 
si ; l'x se lie : si-z ans, si-z hommes ; quand il est substantif ou final, il se prononce sis' : le sis' du mois, Louis sis', un sis' de coeur ; nous étions sis'
Le rétablissement de la finale est contemporain. Il est dû à l'emploi absolu de l'adjectif et à la forme en finale. La forme le six mai devient fréquente même si l'adjectif se trouve devant consonne et à l'intérieur d'un groupe nominal. 
 

VII   septem

Le thème indo-européen *sept-m est assimilé à *dek-m (X). Le grec hepta lui est apparenté avec perte de la sifflante. Il y a eu modification de la voyelle finale dans des composés comme Septimanie devant consonne, mais ce fait n'est pas absolu (septem-bre). 

cat. : set 
cor. : sette 
esp. : siete 
it. : sette 
oc. : sèt 
port. : sete 
rom. : siat 
rou. : şapte 

Les formes romanche et espagnole s'expliquent par une assimilation progressive de la consonne p, ce phénomène est plus rare. En tout cas, il produit une diphtongaison locale non attendue de la voyelle qui est entraînée en arrière et qui s'allonge.

Le latin septem perd sa consonne finale dès la fin de l'époque républicaine. La voyelle finale s'amuït normalement avant VIIe s. dans l'ensemble de la Gaule. 

L'assimilation régressive de la sourde p à la consonne se produit après le IIIe s. comme le montre la forme roumaine. Il a existé en français une forme rare d'assimilation progressive avec sep (980).

Le mot s'est d'abord écrit sep (980), puis set (1050). L'assimilation régressive est la forme la plus fréquente lorsque deux consonnes de timbre voisin sont en contact. La graphie sept (1190) est une réfection étymologique. Cette forme savante explique des prononciations comme la Bible des Septante alors que le p est absent normalement... Toutefois, l'accentuation de sept a préservé la prononciation du mot et la lettre étymologique ne se fait pas entendre autrement que dans les dérivés. 

Littré : 
sè ; le p ne se prononce jamais ; le t se lie : sè-t hommes ; le t se prononce lorsque le mot est pris à part : le nombre sèt', ils étaient sèt', dix-sept, trente-sept, etc. ; on prononce aussi le sèt' du mois, le sèt' de coeur
Le rétablissement de la consonne finale en position absolue est un fait contemporain. 

 

VIII   octo

Le mot se rattache à *oktō.

Huit (indo-européen *okt) ni neuf (*newn) n'ont laissé beaucoup de traces. 

cat. : vuit 
cor. : ôttu 
esp. : ocho 
it. : otto 
oc. : vue 
port. : oito 
rom. : otg 
rou. : opt 

Le passage du roumain de octo à opt est analogique et il ne répond pas aux règles d'évolution du groupe qu dans cette langue. 

La métathèse du romanche avec otg s'explique probablement par l'influence germanique et le fait que d'autres numéraux aient employé une fricative ch.

Le latin octo a d'abord été produit sous la forme oit. La voyelle i résulte de la  palatalisation de k devant consonne sauf r, la consonne vélaire donne naissance à un yod de transition et okto devient oyto en passant par otyo. Cette métathèse est normale et attendue, on la retrouve en catalan, portugais et même espagnol malgré les évolutions futures. Néanmoins, elle n'est pas pan-romane comme en témoigne la forme roumaine, et elle n'a pu se produire qu'après le IIIe s. 

La diphtongue produit ensuite une voyelle arrondie antérieure fermée u  : oy > uoy. Cette forme se réduit en roman avec uy, à date pré-littéraire.  Cette forme explique les catalan et occitan vuit et vue. La présence d'une diphtongue oi est attestée du XIe s. au
XIVe s., la graphie uit est utilisée du XIe s. au XIIIe s. En français, c'est la forme la plus récente qui l'a emporté alors que le franco-provençal conserve la prononciation la moins avancée, comme c'est l'habitude pour les isolats.

La graphie avec h est faussement étymologique et elle remonte en fait à Chrétien de Troyes au XIIe s., mais elle ne commence à l'emporter qu'en moyen français en éliminant d'abord uit, puis oit. Elle devient générale en français classique. Ce mot se comporte comme huis, huile, huître (voir la page qui leur est consacrée). 

Le caractère monosyllabique du mot et sa forme avec en fait une seule diphtongue a entraîné la production d'une disjonction. Cette disjonction a pris la forme v en catalan, occitan, franco-provençal et même en bourguignon veuit. On a alors affaire à la consonnification de la semi-voyelle initiale. 

Littré note : 
ui ; le t se lie : ui-t hommes ; le t ne se prononce pas devant une consonne : ui chevaux, excepté quand huit est substantif : un uit' de chiffre ; quand huit finit un membre de phrase : ils sont uit' ; et quand huit est seul : cinq, six, sept, huit. L'h n'est pas aspirée dans huit ; cependant l'article le ne prend pas d'apostrophe et se prononce : le huit ; on dit de même ce huit et non cet huit, un énorme huit et non un énorm' huit. Les consonnes qui le précèdent ne se lient pas avec huit : un huit, excepté dans les nombres composés avec dix ou vingt et huit : dix-huit, dites di-z ui, vingt-huit, dites vin-t ui ; ces composés se comportent ensuite comme huit lui-même : di-z ui-t hommes, di-z ui chevaux, ils sont di-z uit'

Les formes de la disjonction se sont bien maintenues.La tendance actuelle est d'ailleurs à  la disjonction. Mais cette forme a influencé aussi un et onze qui sont monosyllabiques. En revanche, la remarque de Littré sur la prononciation absolue est totalement périmée. Le t final a été rétabli sous l'influence de l'orthographe et de la liaison. 

IX   novem

Le thème *new-(e)n se retrouve dans l'anglais nine, l'irlandais nóin, l'ordinal latin nōnus. Le grec ennéa a développé une voyelle épenthétique propre. La finale a subi l'influence de decem, puis de septem

On a affaire à une séparation totale entre les familles indo-européennes. Les dérivés en non- en français sont savants. Les langues germaniques ont privilégié une assimilation régressive, en revanche.

9 n'est pas lié à neuf, "nouveau".

cat. : nou 
cor. : novu 
esp. : nueve 
it. nove 
oc. : nòu 
port. :  nove 
rom. : nov 
rou. : nouă 

Le roumain conserve la forme la plus proche du latin. Le mot n'a subi aucune diphtongaison (contrairement au français, à l'occitan, au catalan, à l'espagnol) et la semi-voyelle ne s'est pas consonnifiée (contrairement au français, à l'italien, à l'espagnol, au portugais). Enfin, la voyelle finale, un e caduc, est médiane. 

Le mot neuf provient de novem. Il suit les mêmes règles que septem et decem, avec les apocopes successives de m, puis de e, à l'époque romane. 

Le passage de nove(m) à neuf est proprement français, il concerne toutes les occlusives en finale absolue comme bœuf, œuf. La vibrante sonore devient alors une fricative sourde et non une fricative sonore 

La forme a d'abord été écrite nof (1119). Toutefois la diphtongaison a dû exister en ancien français comme pour deux , une forme comme noef (XIIe s.) le montre. 

Il n'y a jamais eu de volonté de distinction d'homonyme avec neuf issu de novus, ce qui est proprement étonnant...

La prononciation fait entendre la consonne sonore en liaison dans neuf heures et neuf ans (consonne v), mais non dans d'autres groupes comme neuf enfants ou neuf élèves (consonne sourde f). La raison tient sans doute au fait que le changement d'articulation ancien a pu être maintenu dans des expressions fréquentes qui n'ont pas changé avec les siècles comme an et heure. En revanche, dans les autres groupes moins figés, la liaison s'est perdue alors que Meigret constatait encore au
XVIe s. le changement de prononciation de f en v dans d'autres mots terminés par -if