Site web

Un site web, ou simplement site, est un ensemble de pages web et de ressources reliées par des hyperliens, défini et accessible par une adresse web. Un site est développé à l'aide de langages de programmation web, puis hébergé sur un serveur web accessible via le réseau mondial internet, un intranet local, ou n'importe quel autre réseau, tel le darknet.

L'ensemble des sites web publics constituent le World Wide Web.

Histoire

WorldWideWeb
Capture d'écran du navigateur World Wide Web.

Le World Wide Web (WWW) a été créé en 1989 par l’ingénieur anglais du CERN Tim Berners-Lee. Le web a été essentiellement conçu pour partager automatiquement des informations entre les scientifiques, universités et instituts du monde entier. info.cern.ch fut le premier site web mis en ligne, fonctionnant sur un ordinateur NeXT au CERN. Ce site est toujours accessible par internet[1]. Le premier site web français est créé en 1992 au CNRS[2]. A cette période, il existe seulement 26 sites web[3].

Avant l’introduction de HTML et HTTP, d’autres protocoles tels que FTP et Gopher étaient utilisés pour obtenir des fichiers depuis un serveur. Ces protocoles offraient une organisation hiérarchique de répertoires dans lesquels l’utilisateur naviguait et choisissait les fichiers à télécharger. Les documents étaient principalement des fichiers texte sans mise en page et des fichiers encodés par un traitement de texte.

Définition

Aujourd’hui, le Web est accessible via le protocole HTTP (HyperText Transfer Protocol) et les URL (Uniform Resource Locator). Les fichiers hébergés sur le site web reposent sur du HTML (HyperText Markup Language) CSS et JavaScript qui sont les langages nativement compris par les navigateurs modernes. Le protocole HTTP permet au client (généralement via un navigateur web) d'accéder à des ressources par un URL. HTML et de structurer les données ou lier les ressources entre elles, notamment avec des liens hypertextes.

On parle parfois de « site internet » au lieu de site web. On devrait parler de site web à destination d'internet, mais par abus de langage, l'expression site internet reste souvent utilisée. Les sites web ne sont pas forcément accessibles par internet. Par exemple, les intranet peuvent contenir un ou plusieurs sites web non accessibles via internet.

Organisation d'un projet web

Les différentes étapes de la conduite d'un projet web peuvent être résumées ainsi[4] :

  1. lancement : étude des besoins, de la concurrence et de l'existant pour l'établissement d'un cahier des charges ;
  2. conception : élaboration de la structure (arborescence), du contenu des pages web et en particulier de la page d'accueil et éventuellement un moteur de recherche, du graphisme, qui font partie du cahier des charges fonctionnel ;
  3. réalisation : voir ci-dessous ;
  4. production : le site est mis en ligne, devient accessible au public ciblé ;
  5. exploitation : phase de maintenance et de promotion du site, avec notamment le référencement naturel (Netlinking) ou payant (Google Adwords, Microsoft Adcenter, ou autres).

L'étape de réalisation comprend :

  • la réservation et gestion d'un nom de domaine (l’adresse web à laquelle le site est accessible) ;
  • la mise en œuvre d'une infrastructure d'hébergement du site (serveurs web, base de données...) ;
  • le développement de l'interface utilisateur (frontend), la partie visible dans le navigateur ; les différentes pages sont décrites en langages connus des navigateurs web, principalement HTML, CSS et JavaScript. Les éléments graphiques (et éventuellement des publicités servant à rémunérer le site) sont intégrés dans ces pages ;
  • le développement de l'arrière plan (backend), la partie qui fonctionne côté serveur.

La création d'un site peut être confiée à une agence web, un travailleur indépendant, ou faite soi-même. Si la création est déléguée, il est important en amont d'avoir défini un premier cadrage ou cahier des charges du projet. Pour développer un site web soi-même, il est possible d'utiliser un éditeur de pages web ; pour les développeurs web avertis, un simple éditeur de texte peut suffire. On peut aussi avoir recours à un système de gestion de contenu.

Systèmes de gestion de contenu

Les systèmes de gestion de contenu (initiales SGC, CMS en anglais) permettent de fabriquer des sites web en utilisant des modèles pré-établis faits par des programmeurs ou des communautés de programmeurs (voir Liste de systèmes de gestion de contenu). Ces logiciels sont disponibles pour les débutants et simplifient certaines étapes comme la programmation informatique ou l'architecture du site. Les procédures de demande du nom de domaine, d'hébergement du site et de référencement sont semblables aux sites personnalisés classiques.

Structure des pages

Un site web est un ensemble de pages qui peuvent être consultées en suivant des hyperliens à l'intérieur du site. L'adresse web d'un site correspond en fait à l'URL d'une page web, prévue pour être la première consultée : la page d'accueil. La consultation des pages d'un site s'appelle une « visite », car les hyperliens devraient permettre de consulter toutes les pages du site sans le quitter (sans devoir consulter une page web hors du site). Une visite peut commencer par n'importe quelle page, particulièrement lorsque son URL est donnée par un moteur de recherche. Techniquement, rien ne distingue la page d'accueil d'une autre page.

Sites statiques et dynamiques

Server-side websites programming languages
Répartition des langages de programmation côté serveur, des sites web le 28 avril 2016.

On distingue deux types de sites : les sites statiques et les sites dynamiques.

Sites statiques

Ces sites ont le mécanisme de fonctionnement le plus simple : les URL correspondent à un fichier renvoyé par le serveur web. Le contenu des pages d'un site statique ne dépend donc pas de variables telles que la date ou de bases de données. Pour changer le contenu d'une page, il est nécessaire de changer le contenu du fichier.

En outre, les visiteurs peuvent seulement voir le contenu du site mais pas y participer. Pour les réaliser, seuls les langages dits d'interface utilisateur (frontend) sont nécessaires, c'est-à-dire HTML, CSS et JavaScript (en théorie, il est toutefois possible d'utiliser uniquement le HTML).

  • Le HTML permet d'écrire le contenu de sa page ;
  • Le CSS permet de mettre en page le contenu (emplacement des éléments), et mettre en forme le texte (police d'écriture, couleur, taille). Depuis CSS3, il est également possible de créer des modifications plus évoluées (animation, ombres, etc.) ;
  • JavaScript permet d'ajouter du dynamisme, mais uniquement du côté du navigateur (par exemple des animations graphiques).

Sites dynamiques

Ces sites offrent un contenu qui peut évoluer dans le temps. Des programmes tournent du côté des serveurs, à l'arrière plan, (backend) pour générer les pages du site. Ces programmes peuvent se servir de bases de données ou autres sources de données pour composer les pages qui seront affichées dans le navigateur.

Ce dynamisme apporte des fonctionnalités que ne peuvent pas offrir les sites dits statiques. Par exemple les visiteurs peuvent y participer (commentaires sur un blog, changement du contenu des pages d'un wiki...). Ils ont donc pratiquement supplanté les sites statiques au début des années 2000.

Pour les réaliser, on a également besoin de HTML, de CSS et de JavaScript, mais les programmes qui tournent du côté serveur utilisent d'autres langages qui peuvent créer dynamiquement les pages, en analysant les requêtes des visiteurs pour ensuite fabriquer une réponse adaptée.

Il existe plusieurs langages pour créer ces pages : PHP, Java, C#, Ruby, voire d'autres comme C++, Python et Visual Basic via l'interface CGI.

Leur temps de chargement est généralement plus long que pour les pages statiques, toutefois il est possible d'obtenir des valeurs proches en stockant les pages dynamiques déjà appelées dans une mémoire cache, qui les réaffichera plus vite.

Nombre

Le nombre de sites web est en progression constante[5],[6] :

Nombre des sites web consultables
(par année)
Année Nombre
1991 (août) 1
1991 10
1992 26[3]
1993 623[7]
1994 10 022
1995 62 800[8]
1997 1 000 000
2000 10 000 000
2003 (fév.) 35 863 952
2004 57 000 000
2005 74 000 000
2006 101 000 000
2007 155 000 000
2008 186 000 000
2009 (nov.) 207 316 960
2010 (fév.) 233 636 281
2011 (avr.) 312 693 296
2012 (jan.) 582 716 657
2014 (nov.) 947 029 805 (dont 177 782 668 actifs)[9]

Selon les pays

En , les statistiques, en nombre de sites par habitant, montrent une disparité très forte entre les pays :

  1. Drapeau de l'Allemagne Allemagne : 85  ;
  2. Drapeau du Danemark Danemark : 72  ;
  3. Drapeau : Royaume-Uni Royaume-Uni : 64  ;
  4. Drapeau des États-Unis États-Unis : 64  ;
  5. Drapeau de la France France : 11 .

De plus, en 2013 les pays qui hébergent le plus de sites sont :

  1. Drapeau des États-Unis États-Unis : 42 % ;
  2. Drapeau de l'Allemagne Allemagne : 7 % ;
  3. Drapeau de la République populaire de Chine Chine : 3,6 % ;
  4. Drapeau : Royaume-Uni Royaume-Uni : 3,6 % ;
  5. Drapeau de la Russie Russie : 3,5 % ;
  6. Drapeau de la France France : 3,5 % ;
  7. Drapeau du Japon Japon : 3 % ;
  8. Drapeau des Pays-Bas Pays-Bas : 2,6 %.

Selon les langues

En 2015, plus de la moitié des sites web sont en anglais[10].

Fin 2017 les 10 langues les plus utilisées sur internet sont[11]:

  • Anglais avec 25.4 % d'utilisateurs (par rapport à l'ensemble des internautes)
  • Chinois avec 19.3% d'utilisateurs
  • Espagnol avec 8.1% d'utilisateurs
  • Arabe avec 5.3% d'utilisateurs
  • Portugais avec 4.1 % d'utilisateurs
  • Indonésien/Malaisien avec 4.1 % d'utilisateurs
  • Français avec 3.2 % d'utilisateurs
  • Japonais avec 2.9 % d'utilisateurs
  • Russe avec 2.6 % d'utilisateurs
  • Allemand avec 2.2 % d'utilisateurs

Technologies

Les technologies mises en œuvre pour un site web sont multiples. On peut les classer ainsi :

Protocoles de communication

Formats de contenus web

Formats de documents :

Formats d'images graphiques. Utilisés pour agrémenter les pages et sont reconnus par tous les navigateurs web.

Autres formats souvent utilisés, requièrent un module d'extension, ou plug-in, sur le navigateur pour fonctionner :

Technologies serveur

Maintenance de site web

La maintenance d’un site web consiste en général à s’assurer de son bon fonctionnement ; on peut distinguer quatre types de maintenances :

La maintenance corrective

Elle consiste à corriger les problèmes et les défauts de fonctionnement ayant survenu d’une manière inattendue[12].

La maintenance préventive

Un problème a été identifié, mais n’est pas apparu ; alors, pour prévenir le dysfonctionnement d’un site web, on va corriger le bug à l’avance.

La maintenance évolutive

La maintenance évolutive consiste à améliorer les services d’un site web et d’ajouter de nouvelles fonctionnalités pour qu’il soit adapté aux nouvelles exigences des utilisateurs.

La maintenance adaptative

La maintenance adaptative consiste à améliorer le contenu d’un site web pour qu’il soit compatible avec les nouvelles contraintes technologiques (navigateurs, taille des écrans…).

Réglementation en France

Les contenus mis en ligne par l'intermédiaire d'un site web doivent respecter les règles légales et en particulier :

Un certain nombre de mentions légales doivent également figurer sur les sites dans une rubrique du même nom afin de donner aux internautes les informations obligatoires prévues par les différents textes de loi.

Depuis la réforme du droit d'auteur en 2006[13], il existe un dépôt légal de l'Internet[14]. Dans une logique de continuité des collections, la loi DADVSI prévoit le partage de l'archivage du web entre deux institutions dépositaires : l'Institut National de l'Audiovisuel gère le dépôt légal des sites du web médiatique tandis que la Bibliothèque nationale de France est chargé d'archiver l'ensemble des autres sites du web français. Elles collectent essentiellement les .fr mais aussi l'ensemble des noms de domaine dont l'éditeur est installé en France, quelle que soit l'extension[15].

Notes et références

  • Cet article est partiellement ou en totalité issu de l'article intitulé « Maintenance de site web » (voir la liste des auteurs).
  1. « Le berceau du web », CERN.
  2. « Comment le premier site web français a vu le jour au CNRS », sur CNRS Le journal (consulté le 9 mars 2019)
  3. « World-Wide Web Servers », sur www.w3.org (consulté le 9 mars 2019)
  4. Vincent Hiard, Gestion d'un projet web : Planification, pilotage et bonnes pratiques, Éditions ENI, (ISBN 2746068273).
  5. En juillet 2009, à l'occasion des 20 ans du Web, une étude du CERN recense cette évolution. Source :Jean-Paul Pinte, « Le Web invisible : l'antre du cybercrime », Pour la Science, no 70,‎ , p. 100
  6. Source : Netcraft
  7. « Internet Statistics: Web Growth, Internet Growth », sur www.mit.edu (consulté le 9 mars 2019)
  8. « Web Server Survey | Netcraft », sur news.netcraft.com (consulté le 9 mars 2019)
  9. http://news.netcraft.com/archives/category/web-server-survey/
  10. (en) « Percentages of Websites Using Various Content Languages »,
  11. « Top Ten Internet Languages in The World - Internet Statistics », sur www.internetworldstats.com (consulté le 20 janvier 2019)
  12. Christophe AUBRY, Créez votre premier site web, Editions ENI, , 500 p. (ISBN 978-2746095656)
  13. Légifrance LOI no 2006-961 du 1er août 2006 relative au droit d'auteur et aux droits voisins dans la société de l'information.
  14. Légifrance Code du patrimoine - Article L. 131-2.
  15. Légifrance Code du patrimoine - Article R. 132-23.

Voir aussi

Articles connexes

  • Portail de l’informatique
  • Portail d’Internet
  • Portail des langues
Amphibian Species of the World

Amphibian Species of the World (abréviation ASW) est le site web sur les amphibiens du Muséum américain d'histoire naturelle (AMNH).

Il est maintenu par l'herpétologiste Darrel Richmond Frost.

Animal Diversity Web

L'Animal Diversity Web (abréviation ADW) est le site web du muséum de zoologie de l'université du Michigan.

Anime News Network

Anime News Network, abrégé en ANN, est un site web d'actualité sur l'industrie de l'anime, du manga, des jeux vidéo, de la musique populaire japonaise et d'autres cultures connexes au Japon, en Amérique du Nord, en Australasie et en Asie du Sud-Est. En outre, il présente parfois des événements similaires à travers le monde. Le site propose également des critiques, des forums, et une encyclopédie participative de type wiki contenant un large nombre de mangas et d'anime avec des informations à propos du personnel japonais et anglais, des chansons thèmes, des résumés d'intrigue et des notes des utilisateurs. En outre, il présente parfois des événements similaires à travers le monde.

Fondé en juillet 1998 par Justin Sevakis, le site web prétend être la principale source de nouvelles et d'informations en anglais sur les anime et les mangas sur Internet.

En décembre 2014, le site reprend les publications d'Anime Manga Presse via sa filiale AM Media Network.

Une version française est actuellement en phase de test, présentant pour le moment des traductions d'articles anglais et publie également des articles issus du site d'AnimeLand.

Base Mérimée

La base Mérimée est une base de données sur le patrimoine architectural français mise à jour périodiquement. Elle a été créée en 1978 et mise en ligne en 1995 par le ministère de la Culture et de la Communication, direction de l'Architecture et du Patrimoine.

Le nom fait référence à l'écrivain Prosper Mérimée, également inspecteur général des monuments historiques.

Baseball-Reference.com

Baseball-Reference.com est un site Internet fournissant des statistiques de baseball, principalement au sujet des joueurs et des équipes de la Ligue majeure de baseball. Fondé en 2000, le site offre une grande variété de statistiques, incluant plusieurs données sabermétriques, et est un outil largement utilisé par les médias et commentateurs sportifs.

Catalogue of Life

Catalogue of Life est une base de données de taxinomie des espèces accessible sur internet. L’intérêt de ce site est de collecter les informations sur une centaine de bases de données spécialisées (par exemple FishBase et ITIS). Ceci permet à Catalogue of Life de présenter en juin 2013 plus de 1 352 358 taxons.

GameSpot

GameSpot est un site Web d'origine américaine traitant du jeu vidéo, lancé en mai 1996 et créé par Pete Deemer, Vince Broady, et Jon Epstein. Le siège se trouve à San Francisco.

GameSpot présente le jeu vidéo, le logiciel et le matériel informatique à travers des tests, des avant-premières, des téléchargements, des nouvelles et d'autres informations. Après avoir commencé indépendamment, GameSpot a été acheté par ZDNet. Plus tard, ZDNet a été lui-même acheté par CNET Networks, qui possèdent actuellement GameSpot.

Le site est pourvu d'une large équipe de professionnels de l'audiovisuel et du milieu vidéoludique de tous les bords et de toutes les nationalités (pourvu que la langue anglaise soit maîtrisée) qui s'élargit tous les ans. Le site possède en outre une vaste communauté dont certains membres officient en tant que membre non officiel et secondaire en aidant dans leurs différentes tâches les membres principaux.

IGN (site web)

IGN (anciennement Imagine Games Network et officiellement IGN Entertainment Inc.) est un groupe multimédia créé par Jonathan Simpson-Bint gérant notamment un site internet anglophone de jeux vidéo. Fondé en 1996, il s'agit d'un des pionniers du jeu vidéo. Il est le second site de jeux vidéo le plus visité au monde après Yahoo! Games, d'après Alexa.

Présent dans 95 pays, le groupe multimédia revendique plus de 56 millions de visiteurs mensuels uniques. Une version française exploitée par Webedia est lancée le 2 février 2015.

Le groupe appartient à J2 Global.

MLB.com

MLB.com est le site Internet officiel de la Ligue majeure de baseball détenu par la société MLB Advanced Media. L'acronyme « MLB » réfère à Major League Baseball.

Le site, lancé en 2001, publie de l'information concernant le baseball en général, mais plus particulièrement sur les activités des deux circuits qui font partie des ligues majeures, la Ligue américaine et la Ligue nationale. On y retrouve les résultats et les sommaires des matchs, les statistiques individuelles et celles relatives aux 30 équipes en activité, les plus récentes nouvelles concernant ce sport et de l'information complète sur les règlements de la ligue.

MLB.com propose aussi un service payant (MLB.tv) permettant aux abonnés de visionner les matchs. La marchandise officielle des Ligues majeures de baseball est aussi en vente sur le site.

Le site est rédigé en anglais, en espagnol, en japonais, en chinois traditionnel et en chinois simplifié.

Le portail Internet précédent des Ligues majeures se trouvait à l'adresse majorleaguebaseball.com. En 2000, les ligues majeures en sont venues à un accord avec la firme d'avocats Morgan, Lewis & Bockius, propriétaire depuis 1994 du nom de domaine MLB.com, et le site de baseball fut déménagé à son adresse actuelle.

Metacritic

Metacritic est un site Web américain de langue anglaise qui collecte les notes attribuées aux albums de musique, jeux vidéo, films, émissions de télévision, DVD et livres dans les tests anglophones. Pour chaque produit, un score numérique est obtenu et le total est ramené à une moyenne en pourcentage.

Metacritic a été fondé en 1999 et racheté en août 2005 par la société CNET Networks, elle-même rachetée par CBS Corporation en 2008.

NASA/IPAC Extragalactic Database

La NASA/IPAC Extragalactic Database (ou NED) est une base de données astronomiques en ligne spécialisée dans les objets célestes extragalactiques tels les galaxies et les quasars. NED est opérée, sous contrat avec la NASA, par le Jet Propulsion Laboratory sur le campus de la California Institute of Technology.

Oiseaux.net

Le site web Oiseaux.net est un site web associatif fournissant des milliers de photos et dessins couvrant plus de 7 000 espèces d'oiseaux de France et du monde,.

Le but du site oiseaux.net, géré par l'association Ecopains d'abord, est de faire partager sa passion pour les oiseaux et la nature en général.

Le site est maintenu par des bénévoles ornithologues ou non qui contribuent à son enrichissement et s'inscrivent dans une démarche éco-citoyenne.[réf. nécessaire]

Rotten Tomatoes

Rotten Tomatoes est un site Web, créé en 1998, dévolu aux critiques et aux informations sur les films. Le nom provient du cliché datant de l'époque du vaudeville, où jeter des tomates pourries (en anglais : rotten tomatoes) sur les acteurs était une façon pour le public de souligner la médiocrité d'une représentation.

Système d'information taxonomique intégré

Le système d'information taxonomique intégré (SITI), originellement en anglais Integrated Taxonomic Information System (ITIS), est une association créée pour fournir des informations conformes et fiables sur la taxonomie des espèces biologiques.

The Plant List

The Plant List (La liste des plantes) est une base de données de toutes les espèces de plantes connues, recensées par leurs noms scientifiques. Elle est issue de la collaboration entre les jardins botaniques royaux de Kew et le jardin botanique du Missouri qui ont combiné les listes de plantes détenues par ces institutions et par d'autres.

La version 1 publiée en décembre 2010 comprend 1 040 426 noms scientifiques d'espèces de plantes dont 298 900 (28,7 %) sont des noms acceptés et les autres des synonymes ou des noms non résolus. Elle vise à l'exhaustivité pour les espèces de plantes vasculaires (plantes à fleurs, conifères, fougères et leurs alliées) ainsi que pour les Bryophytes (mousses et hépatiques).

Transfermarkt

Transfermarkt est un portail web allemand axé sur le football et proposant des informations sur les résultats et sur les transferts. D'après IVW (en), il est l'un des 25 sites allemand les plus visités et l'un des principaux portails sportifs.

Universal Biological Indexer and Organizer

L’Universal Biological Indexer and Organizer (UBIO) a pour but d'offrir à la communauté scientifique des outils permettant de consulter et d'enrichir une base de données concernant les noms scientifiques et ainsi que l'arbre de classification taxonomique de toutes les espèces recensées d'organismes vivants.

World Register of Marine Species

Le World Register of Marine Species, souvent abrégé en WoRMS, est une base de données qui cherche à fournir une liste à jour des noms de taxons des organismes marins.

World Spider Catalog

Le World Spider Catalog (abréviation WSC) est le site web sur les araignées du Muséum américain d'histoire naturelle.

Il est maintenu par l'aranéologiste Norman I. Platnick.

Il fait suite aux catalogues publiés par Roewer, Brignoli puis Platnick.

Dans d’autres langues

This page is based on a Wikipedia article written by authors (here).
Text is available under the CC BY-SA 3.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.