S. Al-ansary, M. Nagi, and N. Adly, Towards Analyzing the International Corpus of Arabic, 2008.

L. Al-sulaiti and E. Atwell, « The Design of a Corpus of Contemporary Arabic (CCA) », School of Computing research report, vol.11, 2003.

L. Al-sulaiti and E. Atwell, « Extending the Corpus of Contemporary Arabic, Proceedings of Corpus Linguistics, 2005.

S. Atkins, J. Clear, and N. Ostler, Corpus Design Criteria », Literary and Linguistic Computing, vol.7, pp.1-16, 1992.

E. Badawi, M. Carter, and A. Et-gully, Modern Written Arabic. A comprehensive Grammar. London and, 2004.
DOI : 10.4324/9780203351758

D. Biber, Representativeness in Corpus Design », Literary and linguistic Computing, vol.8, pp.243-257, 1993.
DOI : 10.1007/978-0-585-35958-8_20

E. Ditters, « Arabic Corpus Linguistics in Past and Present, Studies in the History of Arabic Grammar II, pp.129-141, 1990.
DOI : 10.1075/sihols.56.11dit

B. Habert, Linguistique sur corpus. Etudes et réflexions. Cahiers de l'Université de Perpignan n° 31, pp.12-58, 2000.

B. Habert, « Portrait de linguiste(s) à l'instrument, 2004.

B. Habert, C. Fabre, and F. Isaac, De l'écrit au numérique. Constituer, normaliser et exploiter les corpus électroniques, 1998.

B. Habert, A. Nazarenko, A. Salem, A. C. Paris, and D. Malrieu, La Linguistique de corpus, Actes des deuxièmes journées de la linguistique de corpus, Lorient 12-14 septembre, Les linguistiques de corpus, pp.115-129, 1997.

D. Malrieu and F. Et-rastier, Genres et variations morphosyntaxiques, vol.42, pp.548-577, 2001.
URL : https://hal.archives-ouvertes.fr/halshs-00161624

D. Mayaffre, Rôle et place des corpus en linguistique : réflexions introductives », Texto !, 2005.

C. Pinon, La grammaire arabe : entre théories linguistiques et applications didactiques », Synergies Monde arabe n°7, pp.75-86, 2011.

J. Sinclair, Preliminary Recommandations on Text Typology, 1996.

M. Van-mol, P. Leuven, and M. Van-mol, «Arabic and the Computer : Possibilities and perspectives for scientific research and educational purposes, Variation in Modern Standard Arabic in Radio News Broadcasts. A synchronic Descriptive Investigation in the use of complementary Particles, vol.117, pp.299-317, 2003.

P. Voir-larcher and A. Et-girod, il est enseigné à l'école) et moderne son état. Bien souvent encore, on enseigne l'arabe classique classique, ou plutôt, une sui-langue arabe classique. Sur ces deux concepts, classique désigne la variété standard de la langue (l'arabe tel qu, vol.37, pp.137-150, 1990.

, Pour approfondir cette question, Al-lugha al-fu??â : archéologie d'un concept "idéolinguistique" », REMMM n° 124, pp.263-278, 2010.

, Pour une écologie des langues du monde et à Choubachy, C, 1999.

, Elle vise à montrer que le pendant des dialectes est cet arabe littéral moderne (quel que soit le nom qu'on lui donne, il ne s'agit dans tous les cas certainement pas de l'arabe "classique"). Le schéma est volontairement symétrique, mais si nous avions voulu représenter la situation de l'oral, l'espace des dialectes aurait représenté l'écrasante majorité ; si nous avions représenté la situation de l'écrit, le contraire se serait produit : l'espace du littéral aurait été considérable. Il en va de même pour les différentes influences, qui n'ont pas le même impact sur le littéral et sur le dialectal. Comme tout schéma, il s'agit d'une représentation abstraite : la langue, elle, s, Cette représentation schématique n'a pour seul intérêt que de cesser d'opposer les dialectes à l'arabe classique

, ) entre genres (ou register) et types de texte. Les premiers renvoient à des catégories de textes définies selon des paramètres situationnels, les seconds à des catégories de textes définies linguistiquement, Nous pouvons reprendre ici la distinction opérée par Biber, D, pp.244-245, 1993.

. Cf and B. Habert, 2005) qui note que les corpus sont tellement vastes maintenant qu'on ne les lit plus, mais qu'on les explore. La question des outils et des instruments utilisés par le linguiste devient donc cruciale, 2000.

. Cf, , p.125, 2003.

D. Nous-renvoyons-tout-particulièrement-À-malrieu and F. Et-rastier, , 2001.

, car le y?' qui est normalement noté avec deux points diacritiques, est souvent noté sans ces points (ce qui fait de lui un alif maq??ra), alors que le alif maq??ra, un caractère qui a la même forme sans points diacritiques, se voit affublé des deux points. Dans certains romans ou dans certains journaux, l'inversion est même systématique : tous les y?' finaux sont notés comme des alif maq??ra, et viceversa, ce qui génère de nombreuses confusions qu'un homme saurait vite rétablir

. Dans-le, comme al-Maktaba a?-??mila (« la bibliothèque complète »), qui contient 16.000 ouvrages classiques ressortissant aux écrits religieux, juridiques et littéraires, livrés avec un logiciel de recherche et d'exploration des textes. Les initiatives de ce type pour la littérature moderne ne sont pas aussi performantes, car il s'agit bien souvent de fichiers PDF mal numérisés et donc inexploitables. Dans certains projets, des personnes sont payées pour saisir les textes : c'est le cas par exemple pour l'édition d'un très long manuscrit de la S?rat Baybar? entreprise à l, de nombreuses bases de données sont vendues sur CD ou maintenant davantage sur disques durs externes

, Ceci a amené des chercheurs, comme D. Kouloughli, à entièrement vocaliser les textes en transcription avant de les repasser en graphie arabe, de manière à obtenir un texte parfaitement transcrit

S. Nagi, M. Adly, and N. , Pour plus de détails sur ces questions techniques et une présentation des différentes méthodes, nous renvoyons à Al-Ansary, 2008.

, Parmi les outils conçus pour l'arabe accessibles en ligne, mentionnons : aConCorde

D. Sarfiyya,