Lettre c

Lexique des données

Classification

Technique d'apprentissage automatique supervisé

Permet d'attribuer une 'classe' à un objet selon un jeu de test pré-défini. Exemple : reconnaître qu'un chat est un chat grâce à des images de chats.

Cloud Computing

Informatique dans les nuages

Le cloud computing révolutionne l'utilisation des serveurs, puisqu'il n'est plus nécessaire d'avoir des machines physiques pour traiter et stocker l'information. Tout est accessible par Internet, le tout organisé sur des serveurs (machines) distants. Le cloud a énormément réduit les barrières à l'entrée pour les entreprises du numérique.

Clusterisation

Technique d'apprentissage automatique non-supervisé

Processus de regroupement automatique des données basé sur la similarité.

CNIL

Commission Nationale Informatique et Liberté

Autorité publique chargée de veiller à la protection des données personnelles.

Common Crawl

Index le web

Cette fondation met à disposition gratuitement un index de données sur un volume conséquent.

Conseil National du Numérique

commission indépendante, créée en 2011, relative à l’impact des technologies numériques sur l’économie et la société.

Crawling

Extraction de données

Technique d'extraction de données exploitant des robots parcourant une partie du web, en suivant les liens de site en site. Le résultat d'un crawl est généralement stocké 'brut' pour être indexé ou re-travaillé et valorisé.

Crowdsourcing

Stratégie visant à 'faire produire le contenu' par les utilisateurs. Le résultat du crowdsourcing peut être publique comme avec Open Street Map, ou privé et appartenant à une entreprise.

CSV

Comma-separated Values

Format informatique représentant des données tabulaires, séparées par un séprateur (généralement la virgule), dans un fichier texte.