Google Ngram Nasıl Daha Etkili Kullanılır?

Comment utiliser Google Ngram plus efficacement

⌛ Reading Time: 5 minutes

Les études linguistiques et linguistiques auront souvent besoin de données sur la façon dont les mots sont utilisés, en particulier au fil du temps. Bien que la recherche soit une nécessité, disposer d’outils pour vous fournir les données dont vous avez besoin est le bienvenu. La visionneuse Google Ngram est un excellent moyen de trouver rapidement les tendances des mots dans la bibliothèque Google Books.

Dans cet article, nous vous montrons comment utiliser plus efficacement Google Ngram. Tout d’abord, nous allons vous présenter l’outil.

Présentation de Google Ngram

Google maintient une base de données multilingue de la langue publiée. En scannant les livres en masse, le géant de la recherche est capable de traiter le texte et de fournir des statistiques basées sur la fréquence des mots.

Avec le Outil de recherche Google Ngram Viewer, vous pouvez effectuer une recherche parmi ces données. En comparant la popularité relative des mots, vous pouvez cartographier l’évolution de la langue et de la culture au fil du temps.

Cependant, l’outil Google Ngram peut faire bien plus que simplement signaler la fréquence des mots, comme nous le verrons.

Comment effectuer des recherches de base

Avant d’entrer dans les « tactiques » avancées, voyons comment effectuer une recherche de base. Sur la page Google Ngram, saisissez un mot-clé dans le champ de recherche.

Si vous souhaitez inclure toutes les majuscules d’un mot, cochez le bouton Insensible à la casse. Cette recherche inclurait “Tech” et “tech”.

Sous le champ de recherche, vous pouvez également définir des paramètres tels que la plage de dates et le « lissage ». Cette dernière valeur supprime les pics et les creux atypiques de vos données. Les valeurs de lissage inférieures sont plus précises, tandis que les valeurs supérieures révèlent uniquement des tendances plus profondes.

Comment sélectionner un « corps »

Le corpus est la collection de textes que le Ngram Viewer examinera. La valeur par défaut « Anglais » est acceptable pour la navigation occasionnelle, mais peut être très académique.

Choisir un corpus dans Google Ngram.

« English Fiction » reflétera plus fidèlement le langage courant. Le corpus “anglais” standard peut être lourd de non-fiction avec beaucoup de mots techniques.

Bien que le sens profond de votre choix de corpus dépasse le cadre de cet article, Google offre un bref aperçu dans le bon choix pour vous.

Effectuer des recherches avancées

En utilisant des mots de recherche supplémentaires, vous pouvez créer des comparaisons complexes. Pour ce faire, séparez chaque terme par une virgule.

Recherche de plusieurs mots-clés.

Le Ngram Viewer affichera la fréquence relative de vos termes de recherche dans un seul graphique. Ici, vous pouvez survoler les lignes du graphique pour voir des points de données précis.

Cibler un seul point de données.

Vous pouvez également utiliser un astérisque dans vos termes de recherche comme caractère générique. Par exemple, « Bachelor of * » renverrait les résultats de nombreux baccalauréats.

Utilisation de caractères génériques dans les termes de recherche.

Pour trouver tous les inflexions d’un terme, ajoutez le modificateur “_INF”.

Trouver des inflexions dans Google Ngram.

Si un mot comprend de nombreuses parties du discours, vous pouvez être plus précis en utilisant des opérateurs de texte. Les parties valides du discours dans la base de données de Google incluent toutes les suivantes :

  • _ADJ_: adjectif (rapide, grand, intelligent)
  • _ADV_: adverbe (vite, plus tard, toujours)
  • _PRON_: pronom (leur, il, nous)
  • _DET_: déterminant ou article (un, un, le)
  • _ADP_: adposition (prépositions et postpositions)
  • _NUM_: chiffre (premier, deuxième, cinquième)
  • _CONJ_: conjonction (et, ni, mais)
  • _PRT_: particule, qui est une catégorie fourre-tout, rarement utilisée pour d’autres fonctions de mots

Chacun d’eux peut être combiné en phrases. Par exemple, “_ADJ_ boy” renverrait des paires de mots pour l’adjectif et “boy”.

Pour spécifier une partie spécifique du discours pour un terme de recherche, ajoutez-le à la fin. Par exemple, « water_VERB » sans trait de soulignement à la fin. Pour inclure toutes les parties du discours d’un mot donné, utilisez l’opérateur générique après le trait de soulignement.

Variables fonctionnelles, compositions et dépendances

Utilisation de variables fonctionnelles dans Google Ngram.

Les variables fonctionnelles vous permettent de rechercher par la fonction ou le placement des mots.

  • _RACINE_ est un espace réservé pour la racine de l’arbre d’analyse de la phrase. Il s’agit généralement du sujet principal ou du mot modifié par le verbe.
  • _DÉBUT_ indique le début d’une phrase. (“_START_ President Obama” renvoie uniquement les phrases qui début avec la phrase « Président Obama. »)
  • _FINIR_ indique la fin d’une phrase. (« _ADP_ _END_ » renvoie des phrases qui finir dans les prépositions.)

En combinant des termes de recherche avec des opérateurs arithmétiques, vous pouvez effectuer une analyse mathématique simple avec des valeurs pour la fréquence des termes :

  • + ajoute plusieurs expressions dans un seul terme de recherche
  • soustrait l’expression de droite de l’expression de gauche, ce qui permet de comparer rapidement l’utilisation relative de deux termes de recherche.
  • / divise l’expression de gauche par l’expression de droite
  • * multiplie l’expression pour comparer des ngrammes de fréquence très variée. Assurez-vous de mettre le ngram entier entre parenthèses pour éviter que l’astérisque soit analysé comme un caractère générique.
  • : (un deux-points) recherche le ngram à gauche dans le corpus à droite.

Enfin, vous pouvez définir des dépendances avec « => » pour rechercher des relations linguistiques.

Utilisation des dépendances dans Google Ngram.

Par exemple, « voiture=>rapide » renverrait des résultats où « rapide » dépendait grammaticalement du mot « voiture » ​​ou le modifiait. Cela peut être mélangé librement avec n’importe quelle opération de recherche avancée.

Conclusion

La recherche de tendances de mots a de nombreuses applications académiques. L’outil Ngram de Google est un moyen rapide de trouver les informations dont vous avez besoin. La bonne nouvelle est qu’il ne vous permet pas seulement d’effectuer des recherches de base. Vous pouvez appliquer de puissants modificateurs pour affiner les informations dont vous avez besoin.

Aucune des fonctionnalités de Google Ngram ne serait possible sans le grognement avancé du moteur de recherche sous le capot. Êtes-vous impressionné par ce que l’outil Google Ngram peut faire ? Faites-nous savoir dans la section commentaires ci-dessous!

How useful was this post?

Click on a star to rate it!

Average rating 0 / 5. Vote count: 0

No votes so far! Be the first to rate this post.