Apprentissage automatique et catégorisation de textes multilingues

Download Apprentissage automatique et catégorisation de textes multilingues PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 160 pages
Book Rating : 4.:/5 (492 download)

DOWNLOAD NOW!


Book Synopsis Apprentissage automatique et catégorisation de textes multilingues by : Radwan Jalam

Download or read book Apprentissage automatique et catégorisation de textes multilingues written by Radwan Jalam and published by . This book was released on 2003 with total page 160 pages. Available in PDF, EPUB and Kindle. Book excerpt: Notre travail s'intéresse à l'application de méthodes issues de l'apprentissage automatique à la catégorisation de textes multilingues. Il comporte deux parties. Une première partie donne une présentation générale de la catégorisation de textes : Définitions, objectifs généraux et domaines d'application ; Adaptation des algorithmes d'apprentissage aux spécificités des textes ; La méthode de sélection de termes multivariée ; Le codage en n-grammes et les mots ; Les méthodes d'apprentissage et la mesure de leurs performances ; les texts réalisés pour comparer les algorithmes d'apprentissage sur les textes. La deuxième partie s'intéresse a l'apprentissage de textes multilingues en comparant deux chaînes possibles : Chaîne 1 : reconnaissance de la langue, puis utilisation de règles de classement construites pour chaque langue ; il faut alors avoir construit un modèle adapté à chacune des langues. Chaîne 2 : utilisation de la traduction automatique dans le processus de catégorisation ; cette solution permet d'utiliser un seul ensemble de règles de classement. Ici, il y a deux options : 1. Construire un modèle unique sur l'ensemble d'apprentissage d'une langue donnée ; ensuite, pour classer un nouveau texte, (I) reconnaissance de sa langue, (II) traduction de ce texte vers la langue d'apprentissage, (III) application du modèle de prédiction sur le texte traduit ; ici la phase de traduction n'intervient que dans la phase de classement. 2. Faire intervenir la traduction automatique dès la phase d'apprentissage : à partir d'un ensemble étiqueté de textes en différentes langues, traduction automatique dès la phase d'apprentissage : à partir d'un enemble étiqueté de textes en différentes langues, traduction automatique de tous ces textes vers une langue cible et apprentissage sur cet ensemble de textes traduits ; ensuite, pour classer un nouveau texte, la procédure est la même. Nous testons nos algorithmes sur des corpus multilingues.

L'Apprentissage artificiel pour la fouille de données multilingues

Download L'Apprentissage artificiel pour la fouille de données multilingues PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 0 pages
Book Rating : 4.:/5 (8 download)

DOWNLOAD NOW!


Book Synopsis L'Apprentissage artificiel pour la fouille de données multilingues by : Saeed Raheel

Download or read book L'Apprentissage artificiel pour la fouille de données multilingues written by Saeed Raheel and published by . This book was released on 2010 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: La classification automatique des documents, une approche issue de l'apprentissage artificiel et de la fouille de textes, s'avère être très efficace pour l'organisation des ressources textuelles multilingues. Très peu des travaux se rapportent à la classification automatique de documents écrits en caractères arabes malgré la richesse morphologique de cette langue. Pour cela, nous nous intéressons dans cette thèse à la question de la classification automatique des documents écrits en caractères arabes. Il faut noter que pour surmonter les difficultés liées au traitement automatique de l'arabe, nous nous basons dans cette thèse sur une solution très performante celle basée sur la ressource linguistique informatisée de l'arabe DIINAR.1 et son analyseur morphologique. Le choix de la nature des attributs est un élément très important pour une classification automatique efficace et mérite être fait avec le plus grand soin puisqu'il a un effet directe sur la fidélité des classifieurs. Ainsi, nous avons mené dans cette thèse une étude comparative entre les n-grammes, les racines, les lemmes, et les mots comme nature d'attributs qui nous a permis de conclure une instabilité dans la performance des classifieurs basés sur les corpus construit via les n-grammes vis-à-vis d'une stabilité dans le comportement des classifieurs basés sur les corpus construits à partir des racines.De plus, on constate dans la plupart des travaux menés sur des documents écrits en caractères arabes qu'ils se basent sur des algorithmes d'apprentissage modernes comme, par exemple, les machines à vecteurs supports, les réseaux bayésiens naïfs, et les arbres de décision qui sont connus être parmi les meilleurs performants classifieurs du domaine. Toutefois, on ne trouve, à l'heure actuelle, aucun travail portant sur la classification automatique des documents écrits en caractères arabes qui utilise l'algorithme du dopage (« Boosting »). Pour cela, nous avons mené une étude comparative de la fidélité des arbres de décision (C4.5) dopés, d'une part, et les arbres de décision (C4.5) (sans dopage), les machines à vecteurs supports (SMO), et les réseaux bayésiens naïfs (NBM), d'un autre part, en fonction de la classification automatique des documents écrits en caractères arabes. Nous avons constaté que l'algorithme C4.5 boosté n'a pas pu surpasser la fidélité des algorithmes SVM et NBM. Nous attribuons cette faiblesse, sans reprocher le dopage, au fait que les arbres de décision sont très sensibles au moindre changement de leurs données sous-jacentes qui sont régulièrement pondérées et modifiées lors du dopage.Un document arabe peut être rédigé en une seule ou plusieurs langues i.e. le contenu du document est un mélange de mots écrits en caractères arabes ainsi que d'autres écrits en caractère latins. Tous les travaux portant sur la classification automatique des documents écrits en caractères arabes abordent le sujet d'un point de vue monolingue i.e. en exploitant uniquement le texte écrit en caractères arabes et en éliminant tout autre texte écrit dans d'autres langues. En conséquence, une partie vitale des informations présentes dans les documents est perdue délibérément sachant qu'elle aurait pu contribuer à la subjectivité de la décision prise par le classifieur puisque l'attribution d'un document à une catégorie ou une autre se base, principalement, sur son contenu. En conséquent, l'élimination des mots écrits en caractères latins tronque le texte ce qui met en question le degré de la subjectivité de la décision finale prise par le modèle de prédiction. Pour cela, nous nous sommes intéressés aussi dans cette thèse à la classification automatique des documents arabes ayant un contenu multilingues i.e. écrits en plusieurs langues.

Automatic Language Identification in Texts

Download Automatic Language Identification in Texts PDF Online Free

Author :
Publisher : Springer Nature
ISBN 13 : 3031458222
Total Pages : 155 pages
Book Rating : 4.0/5 (314 download)

DOWNLOAD NOW!


Book Synopsis Automatic Language Identification in Texts by : Tommi Jauhiainen

Download or read book Automatic Language Identification in Texts written by Tommi Jauhiainen and published by Springer Nature. This book was released on 2024-02-02 with total page 155 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book provides readers with a brief account of the history of Language Identification (LI) research and a survey of the features and methods most used in LI literature. LI is the problem of determining the language in which a document is written and is a crucial part of many text processing pipelines. The authors use a unified notation to clarify the relationships between common LI methods. The book introduces LI performance evaluation methods and takes a detailed look at LI-related shared tasks. The authors identify open issues and discuss the applications of LI and related tasks and proposes future directions for research in LI.

Advances in Information Retrieval

Download Advances in Information Retrieval PDF Online Free

Author :
Publisher : Springer Science & Business Media
ISBN 13 : 3540714944
Total Pages : 1553 pages
Book Rating : 4.5/5 (47 download)

DOWNLOAD NOW!


Book Synopsis Advances in Information Retrieval by : Giambattista Amati

Download or read book Advances in Information Retrieval written by Giambattista Amati and published by Springer Science & Business Media. This book was released on 2007-03-19 with total page 1553 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book constitutes the refereed proceedings of the 29th annual European Conference on Information Retrieval Research, ECIR 2007, held in Rome, Italy in April 2007. The papers are organized in topical sections on theory and design, efficiency, peer-to-peer networks, result merging, queries, relevance feedback, evaluation, classification and clustering, filtering, topic identification, expert finding, XML IR, Web IR, and multimedia IR.

MICAI 2009: Advances in Artificial Intelligence

Download MICAI 2009: Advances in Artificial Intelligence PDF Online Free

Author :
Publisher : Springer Science & Business Media
ISBN 13 : 3642052576
Total Pages : 759 pages
Book Rating : 4.6/5 (42 download)

DOWNLOAD NOW!


Book Synopsis MICAI 2009: Advances in Artificial Intelligence by : Arturo Hernández Aguirre

Download or read book MICAI 2009: Advances in Artificial Intelligence written by Arturo Hernández Aguirre and published by Springer Science & Business Media. This book was released on 2009-10-26 with total page 759 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book constitutes the refereed proceedings of the 8th Mexican International Conference on Artificial Intelligence, MICAI 2009, held in Guanajuato, Mexico, in November 2009. The 63 revised full papers presented together with one invited talk were carefully reviewed and selected from 215 submissions. The papers are organized in topical sections on logic and reasoning, ontologies, knowledge management and knowledge-based systems, uncertainty and probabilistic reasoning, natural language processing, data mining, machine learning, pattern recognition, computer vision and image processing, robotics, planning and scheduling, fuzzy logic, neural networks, intelligent tutoring systems, bioinformatics and medical applications, hybrid intelligent systems and evolutionary algorithms.

Le traitement automatique des Langues

Download Le traitement automatique des Langues PDF Online Free

Author :
Publisher : Dunod
ISBN 13 : 2100811509
Total Pages : 336 pages
Book Rating : 4.1/5 (8 download)

DOWNLOAD NOW!


Book Synopsis Le traitement automatique des Langues by : Pirmin Lemberger

Download or read book Le traitement automatique des Langues written by Pirmin Lemberger and published by Dunod. This book was released on 2020-02-05 with total page 336 pages. Available in PDF, EPUB and Kindle. Book excerpt: Le traitement automatique du langage est une branche importante de l'intelligence artificielle et du machine learning dont l'objectif est de parvenir à "comprendre" et analyser des textes afin d'en extraire des connaissances sans intervention humaine. Les champs d'application sont à la fois très variés et très vastes (traduction instantanée en plusieurs langues, commandes vocales, agents conversationnels, analyse de CV, veille économique...). Cet ouvrage dresse un état de l'art de cette discipline, en explique les bases théoriques et informatiques, les approches linguistiques classiques et les approches statistiques plus modernes. L'exemple de l'analyse des suggestions rassemblées lors du Grand débat national à l'aide de ces méthodes d'IA sert d'illustration.

Business Intelligence

Download Business Intelligence PDF Online Free

Author :
Publisher : Springer Nature
ISBN 13 : 3030765083
Total Pages : 446 pages
Book Rating : 4.0/5 (37 download)

DOWNLOAD NOW!


Book Synopsis Business Intelligence by : Mohamed Fakir

Download or read book Business Intelligence written by Mohamed Fakir and published by Springer Nature. This book was released on 2021-05-15 with total page 446 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book constitutes the proceedings of the 6th International Conference on Business Intelligence, CBI 2021, which took place in Beni Mellal, Morocco, during May 27-29, 2021. The 26 full and 6 poster papers included in this book were carefully reviewed and selected from a total of 60 submissions. They were organized in topical sections as follows: decision support, information systems and NLP; big data, datamining, Web services and Web semantics; optimization and decision support; signal, image and vision computing; networking, cloud computing and networking architectures in cloud.

Scholarly Ethics and Publishing: Breakthroughs in Research and Practice

Download Scholarly Ethics and Publishing: Breakthroughs in Research and Practice PDF Online Free

Author :
Publisher : IGI Global
ISBN 13 : 1522580581
Total Pages : 948 pages
Book Rating : 4.5/5 (225 download)

DOWNLOAD NOW!


Book Synopsis Scholarly Ethics and Publishing: Breakthroughs in Research and Practice by : Management Association, Information Resources

Download or read book Scholarly Ethics and Publishing: Breakthroughs in Research and Practice written by Management Association, Information Resources and published by IGI Global. This book was released on 2019-03-01 with total page 948 pages. Available in PDF, EPUB and Kindle. Book excerpt: A vital component of any publishing project is the ethical dimensions, which can refer to varied categories of practice: from conducting a proper peer review to using proper citation in research. With the implementation of technology in research and publishing, it is important for today’s researchers to address the standards of scientific research and publishing practices to avoid unethical behavior. Scholarly Ethics and Publishing: Breakthroughs in Research and Practice is an essential reference source that discusses various aspects of ethical values in academic settings including methods and tools to prevent and detect plagiarism, strategies for the principled gathering of data, and best practices for conducting and citing research. It also assists researchers in navigating the field of scholarly publishing through a careful analysis of multidisciplinary research topics and recent trends in the industry. Highlighting a range of pertinent topics such as academic writing, publication process, and research methodologies, this publication is an ideal reference source for researchers, graduate students, academicians, librarians, scholars, and industry-leading experts around the globe.

Exploring Critical Approaches of Evolutionary Computation

Download Exploring Critical Approaches of Evolutionary Computation PDF Online Free

Author :
Publisher : IGI Global
ISBN 13 : 1522558330
Total Pages : 409 pages
Book Rating : 4.5/5 (225 download)

DOWNLOAD NOW!


Book Synopsis Exploring Critical Approaches of Evolutionary Computation by : Sarfraz, Muhammad

Download or read book Exploring Critical Approaches of Evolutionary Computation written by Sarfraz, Muhammad and published by IGI Global. This book was released on 2018-07-13 with total page 409 pages. Available in PDF, EPUB and Kindle. Book excerpt: Modern optimization approaches have attracted an increasing number of scientists, decision makers, and researchers. As new issues in this field emerge, different optimization methodologies must be developed and implemented. Exploring Critical Approaches of Evolutionary Computation is a vital scholarly publication that explores the latest developments, methods, approaches, and applications of evolutionary models in a variety of fields. It also emphasizes evolutionary models of computation such as genetic algorithms, evolutionary strategies, classifier systems, evolutionary programming, genetic programming, and related fields such as swarm intelligence and other evolutionary computation techniques. Highlighting a range of pertinent topics such as neural networks, data mining, and data analytics, this book is designed for IT developers, IT theorists, computer engineers, researchers, practitioners, and upper-level students seeking current research on enhanced information exchange methods and practical aspects of computational systems.

Génération de phrases multilingues par apprentissage automatique de modèles de phrases

Download Génération de phrases multilingues par apprentissage automatique de modèles de phrases PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 0 pages
Book Rating : 4.:/5 (8 download)

DOWNLOAD NOW!


Book Synopsis Génération de phrases multilingues par apprentissage automatique de modèles de phrases by : Éric Charton (docteur en sciences informatiques).)

Download or read book Génération de phrases multilingues par apprentissage automatique de modèles de phrases written by Éric Charton (docteur en sciences informatiques).) and published by . This book was released on 2010 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: La Génération Automatique de Texte (GAT) est le champ de recherche de la linguistique informatique qui étudie la possibilité d'attribuer à une machine la faculté de produire du texte intelligible. Dans ce mémoire, nous présentons une proposition de système de GAT reposant exclusivement sur des méthodes statistiques. Son originalité est d'exploiter un corpus en tant que ressource de formation de phrases. Cette méthode offre plusieurs avantages : elle simplifie l'implémentation d'un système de GAT en plusieurs langues et améliore les capacités d'adaptations d'un système de génération à un domaine sémantique particulier. La production, d'après un corpus d'apprentissage, des modèles de phrases finement étiquetées requises par notre générateur de texte nous a conduit à mener des recherches approfondies dans le domaine de l'extraction d'information et de la classification. Nous décrivons le système d'étiquetage et de classification de contenus encyclopédique mis au point à cette fin. Dans les étapes finales du processus de génération, les modèles de phrases sont exploités par un module de génération de texte multilingue. Ce module exploite des algorithmes de recherche d'information pour extraire du modèle une phrase pré-existante, utilisable en tant que support sémantique et syntaxique de l'intention à communiquer. Plusieurs méthodes sont proposées pour générer une phrase, choisies en fonction de la complexité du contenu sémantique à exprimer. Nous présentons notamment parmi ces méthodes une proposition originale de génération de phrases complexes par agrégation de proto-phrases de type Sujet, Verbe, Objet. Nous envisageons dans nos conclusions que cette méthode particulière de génération puisse ouvrir des voies d'investigations prometteuses sur la nature du processus de formation de phrases.

Handbook of Research on Machine Learning Innovations and Trends

Download Handbook of Research on Machine Learning Innovations and Trends PDF Online Free

Author :
Publisher : IGI Global
ISBN 13 : 1522522301
Total Pages : 1269 pages
Book Rating : 4.5/5 (225 download)

DOWNLOAD NOW!


Book Synopsis Handbook of Research on Machine Learning Innovations and Trends by : Hassanien, Aboul Ella

Download or read book Handbook of Research on Machine Learning Innovations and Trends written by Hassanien, Aboul Ella and published by IGI Global. This book was released on 2017-04-03 with total page 1269 pages. Available in PDF, EPUB and Kindle. Book excerpt: Continuous improvements in technological applications have allowed more opportunities to develop automated systems. This not only leads to higher success in smart data analysis, but it increases the overall probability of technological progression. The Handbook of Research on Machine Learning Innovations and Trends is a key resource on the latest advances and research regarding the vast range of advanced systems and applications involved in machine intelligence. Highlighting multidisciplinary studies on decision theory, intelligent search, and multi-agent systems, this publication is an ideal reference source for professionals and researchers working in the field of machine learning and its applications.

Catégorisation Automatique de Textes Et Cooccurrence de Mots

Download Catégorisation Automatique de Textes Et Cooccurrence de Mots PDF Online Free

Author :
Publisher : Omniscriptum
ISBN 13 : 9786131585333
Total Pages : 116 pages
Book Rating : 4.5/5 (853 download)

DOWNLOAD NOW!


Book Synopsis Catégorisation Automatique de Textes Et Cooccurrence de Mots by : Simon Réhel

Download or read book Catégorisation Automatique de Textes Et Cooccurrence de Mots written by Simon Réhel and published by Omniscriptum. This book was released on 2011-06 with total page 116 pages. Available in PDF, EPUB and Kindle. Book excerpt: Ayant pour objectif de rendre un programme informatique capable d'assigner de façon autonome des documents textuels à leur classe d'appartenance, la catégorisation automatique de textes est rendue possible grâce à l'apprentissage supervisé. Un entraînement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d'entraînement se révèle un processus long et coûteux. Ce mémoire propose une façon d'améliorer la capacité d'un classificateur à bien accomplir sa tâche dans des situations où un entraînement sur un nombre suffisant de textes n'aura pas été possible. L'approche suggérée consiste à étudier une forme d'association, la cooccurrence, entre les mots provenant d'un ensemble de textes libellés et ceux provenant d'un ensemble de textes non libellés, plus volumineux. On espère ainsi augmenter à faible coût le vocabulaire utile à la classification de textes, en minimisant le nombre de documents à étiqueter.

UNE APPROCHE DE LA CATEGORISATION DE TEXTES PAR L'APPRENTISSAGE SYMBOLIQUE

Download UNE APPROCHE DE LA CATEGORISATION DE TEXTES PAR L'APPRENTISSAGE SYMBOLIQUE PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 196 pages
Book Rating : 4.:/5 (49 download)

DOWNLOAD NOW!


Book Synopsis UNE APPROCHE DE LA CATEGORISATION DE TEXTES PAR L'APPRENTISSAGE SYMBOLIQUE by : Isabelle Moulinier

Download or read book UNE APPROCHE DE LA CATEGORISATION DE TEXTES PAR L'APPRENTISSAGE SYMBOLIQUE written by Isabelle Moulinier and published by . This book was released on 1996 with total page 196 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'OBJECTIF PRINCIPAL DES TRAVAUX PRESENTES DANS CETTE THESE EST DE DETERMINER SI LA CLASSIFICATION AUTOMATIQUE, EN PARTICULIER AU MOYEN DE L'APPRENTISSAGE SYMBOLIQUE SUPERVISE, PEUT ETRE APPLIQUEE A LA CATEGORISATION DE DOCUMENTS, TACHE QUI PERMET D'AFFECTER DES CATEGORIES SEMANTIQUES A DES DOCUMENTS EN FONCTION DE LEUR CONTENU. LE MEMOIRE S'ARTICULE AUTOUR DE DEUX AXES COMPLEMENTAIRES. L'AXE PRINCIPAL CONSISTE A DETERMINER SI LES TECHNIQUES D'APPRENTISSAGE APPORTENT DES SOLUTIONS AUX PREOCCUPATIONS DE LA RECHERCHE DOCUMENTAIRE, EN PARTICULIER LE FILTRAGE DE DOCUMENTS. DANS CETTE OPTIQUE, IL EST NECESSAIRE DE PRENDRE EN COMPTE LES CARACTERISTIQUES DES COLLECTIONS TEXTUELLES, EN PARTICULIER CELLES LIEES AUX DIMENSIONS DES DONNEES TEXTUELLES (PLUSIEURS MILLIERS D'EXEMPLES ET DES DIZAINES DE MILLIERS D'ATTRIBUTS), QUI SORTENT DU CADRE CLASSIQUE DES APPLICATIONS DE L'APPRENTISSAGE. CE PROBLEME CONSTITUE LE SECOND AXE DE NOTRE TRAVAIL. POUR DES RAISONS DE COMPLEXITE, NOTRE DEMARCHE EST D'INTRODUIRE UNE ETAPE PREALABLE DE SELECTION D'ATTRIBUTS AVANT TOUT APPRENTISSAGE. CECI NOUS CONDUIT A PROPOSER UNE METHODE ORIGINALE DE REDUCTION, APPELEE SCAR, QUI TIRE PARTI DES CARACTERISTIQUES DES DONNEES TEXTUELLES. NOUS COMPARONS SCAR A DEUX METHODES CLASSIQUES POUR LA REDUCTION DE DIMENSION. NOUS EVALUONS CES METHODES SUR LA COLLECTION REUTERS-22 173, DONT LA TAILLE EST CONSEQUENTE. NOUS NOUS INTERESSONS ENSUITE AUX LIENS ENTRE LE PRESUPPOSE D'APPRENTISSAGE (NATURE DE L'APPRENTISSAGE) ET LES DONNEES TEXTUELLES, DANS L'OPTIQUE D'UNE APPLICATION AU FILTRAGE. NOS RESULTATS MONTRENT QUE, MALGRE LA RELATIVE EQUIVALENCE OBSERVEE EN MOYENNE EN COMPARANT LES DIFFERENTS ALGORITHMES PROPOSES, ON PEUT DISTINGUER UNE REELLE INFLUENCE DU PRESUPPOSE D'APPRENTISSAGE SUR LA PERFORMANCE DE L'ALGORITHME, LORSQUE CELUI EST APPLIQUE A CERTAINES CLASSES DE PROBLEMES QUE NOUS AVONS IDENTIFIE.

Classification du texte numérique et numérisé. Approche fondée sur les algorithmes d'apprentissage automatique

Download Classification du texte numérique et numérisé. Approche fondée sur les algorithmes d'apprentissage automatique PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 0 pages
Book Rating : 4.:/5 (1 download)

DOWNLOAD NOW!


Book Synopsis Classification du texte numérique et numérisé. Approche fondée sur les algorithmes d'apprentissage automatique by : Karim Sayadi

Download or read book Classification du texte numérique et numérisé. Approche fondée sur les algorithmes d'apprentissage automatique written by Karim Sayadi and published by . This book was released on 2017 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Différentes disciplines des sciences humaines telles la philologie ou la paléographie font face à des tâches complexes et fastidieuses pour l'examen des sources de données. La proposition d'approches computationnelles en humanités permet d'adresser les problématiques rencontrées telles que la lecture, l'analyse et l'archivage de façon systématique. Les modèles conceptuels élaborés reposent sur des algorithmes et ces derniers donnent lieu à des implémentations informatiques qui automatisent ces tâches fastidieuses. La première partie de la thèse vise, d'une part, à établir la structuration thématique d'un corpus, en construisant des espaces sémantiques de grande dimension. D'autre part, elle vise au suivi dynamique des thématiques qui constitue un réel défi scientifique, notamment en raison du passage à l'échelle. La seconde partie de la thèse traite de manière holistique la page d'un document numérisé sans aucune intervention préalable. Le but est d'apprendre automatiquement des représentations du trait de l'écriture ou du tracé d'un certain script par rapport au tracé d'un autre script. Il faut dans ce cadre tenir compte de l'environnement où se trouve le tracé : image, artefact, bruits dus à la détérioration de la qualité du papier, etc. Notre approche propose un empilement de réseaux de neurones auto-encodeurs afin de fournir une représentation alternative des données reçues en entrée.

CONCEPTION DE METHODE D'APPRENTISSAGE SYMBOLIQUE ET AUTOMATIQUE POUR L'ACQUISITION DE CADRES DE SOUS-CATEGORISATION DE VERBES ET DE CONNAISSANCES SEMANTIQUES A PARTIR DE TEXTES

Download CONCEPTION DE METHODE D'APPRENTISSAGE SYMBOLIQUE ET AUTOMATIQUE POUR L'ACQUISITION DE CADRES DE SOUS-CATEGORISATION DE VERBES ET DE CONNAISSANCES SEMANTIQUES A PARTIR DE TEXTES PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : 265 pages
Book Rating : 4.:/5 (492 download)

DOWNLOAD NOW!


Book Synopsis CONCEPTION DE METHODE D'APPRENTISSAGE SYMBOLIQUE ET AUTOMATIQUE POUR L'ACQUISITION DE CADRES DE SOUS-CATEGORISATION DE VERBES ET DE CONNAISSANCES SEMANTIQUES A PARTIR DE TEXTES by : David Faure

Download or read book CONCEPTION DE METHODE D'APPRENTISSAGE SYMBOLIQUE ET AUTOMATIQUE POUR L'ACQUISITION DE CADRES DE SOUS-CATEGORISATION DE VERBES ET DE CONNAISSANCES SEMANTIQUES A PARTIR DE TEXTES written by David Faure and published by . This book was released on 2000 with total page 265 pages. Available in PDF, EPUB and Kindle. Book excerpt: CE TRAVAIL DE THESE SE SITUE AU CARREFOUR DE L'ACQUISITION DE CONNAISSANCES, DE L'APPRENTISSAGE AUTOMATIQUE ET DU TRAITEMENT AUTOMATIQUE DU LANGAGE NATUREL. LA METHODE EST FONDEE SUR UNE APPROCHE DISTRIBUTIONNELLE DE LA SEMANTIQUE. LES CLASSES SEMANTIQUES QU'IL EST POSSIBLE D'APPRENDRE A PARTIR D'UN CORPUS ANALYSE SYNTAXIQUEMENT MANQUENT SOUVENT D'HOMOGENEITE QUI REND L'APPROCHE COOPERATIVE INDISPENSABLE. NOUS AVONS CONCU UNE NOUVELLE METHODE D'APPRENTISSAGE COOPERATIF FONDEE SUR UN ALGORITHME DE CLASSIFICATION CONCEPTUELLE IMPLEMENTE DANS LE SYSTEME ASIUM. IL PERMET D'ACQUERIR DES CONNAISSANCES SEMANTIQUES ORGANISEES EN ONTOLOGIE QUI SERONT VALIDEES AU FUR ET A MESURE PAR UN EXPERT DU DOMAINE. LA COOPERATION DE L'EXPERT VIA L'INTERFACE ERGONOMIQUE D'ASIUM LUI PERMET D'INFLUER SUR LE PROCESSUS D'APPRENTISSAGE POUR LE GUIDER ET EN CORRIGER LES RESULTATS. LE SYSTEME CONSERVANT LES LIENS ENTRE LES CONCEPTS APPRIS ET LEURS CONTEXTES SYNTAXIQUES D'UTILISATION FOURNIT DES CONNAISSANCES SPECIFIQUES POUVANT ETRE UTILISEES DANS DE NOMBREUSES APPLICATIONS COMME, PAR EXEMPLE, LA CLASSIFICATION DE TEXTES OU L'EXTRACTION D'INFORMATION.

Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés

Download Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés PDF Online Free

Author :
Publisher :
ISBN 13 :
Total Pages : pages
Book Rating : 4.:/5 (648 download)

DOWNLOAD NOW!


Book Synopsis Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés by :

Download or read book Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés written by and published by . This book was released on 2001 with total page pages. Available in PDF, EPUB and Kindle. Book excerpt: Automated text categorization consists of developing computer programs able to autonomously assign texts to predefined categories, on the basis of their content. Such applications are possible thanks to supervised learning, which implies a training phase on manually labeled documents. However, the construction of a training set is long and expensive. This study suggests a way to assist text classifiers in the gathering of the vocabulary when the size of the training set is limited. So, it is proposed to analyze word cooccurrence inside a text collection of many non-labeled documents, to augment the vocabulary produced by the analysis of the labeled texts. The representation of new documents to classify can then be modified in order to better match the vocabulary used by the classifier. What is expected, of course, is an improvement of its ability to categorize texts.

Machine Learning for Text

Download Machine Learning for Text PDF Online Free

Author :
Publisher :
ISBN 13 : 9783030966249
Total Pages : 0 pages
Book Rating : 4.9/5 (662 download)

DOWNLOAD NOW!


Book Synopsis Machine Learning for Text by : Charu C. Aggarwal

Download or read book Machine Learning for Text written by Charu C. Aggarwal and published by . This book was released on 2022 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: This second edition textbook covers a coherently organized framework for text analytics, which integrates material drawn from the intersecting topics of information retrieval, machine learning, and natural language processing. Particular importance is placed on deep learning methods. The chapters of this book span three broad categories: 1. Basic algorithms: Chapters 1 through 7 discuss the classical algorithms for text analytics such as preprocessing, similarity computation, topic modeling, matrix factorization, clustering, classification, regression, and ensemble analysis. 2. Domain-sensitive learning and information retrieval: Chapters 8 and 9 discuss learning models in heterogeneous settings such as a combination of text with multimedia or Web links. The problem of information retrieval and Web search is also discussed in the context of its relationship with ranking and machine learning methods. 3. Natural language processing: Chapters 10 through 16 discuss various sequence-centric and natural language applications, such as feature engineering, neural language models, deep learning, transformers, pre-trained language models, text summarization, information extraction, knowledge graphs, question answering, opinion mining, text segmentation, and event detection. Compared to the first edition, this second edition textbook (which targets mostly advanced level students majoring in computer science and math) has substantially more material on deep learning and natural language processing. Significant focus is placed on topics like transformers, pre-trained language models, knowledge graphs, and question answering.