La donnée : carburant de la Smart City ?
Un nouveau paysage se dessine où la donnée devient centrale et son partage fondamental pour pouvoir déployer des services, pour mettre en œuvre des dispositifs qui améliorent la performance et la résilience des villes, enfin, pour exploiter de manière transversale et en approche globale des quantités de données intrinsèques à la ville intelligente et issues de tous les acteurs.
L’essor du Big Data
L’utilisation du Big Data pour la ville intelligente permet un stockage et un traitement efficaces des données pour produire des informations susceptibles d’améliorer les différents services de la Smart City. En outre, le Big Data aide les décideurs à planifier l’expansion des services et des ressources. Cependant, le Big Data a besoin des bons outils et méthodes pour une analyse efficace des données. Ces outils et méthodes peuvent encourager la collaboration et la communication entre les acteurs et fournir des services à de nombreux secteurs de la ville intelligente, tout en améliorant “l’expérience client” du citoyen (si on s’autorise une analogie en utilisant les termes du Marketing Digital) et en ouvrant de nouvelles opportunités de marché.
Le Big Data, de quoi parle-t’on ?
Le big data, ou mégadonnées, désignent des ensembles de données devenus si volumineux qu’ils dépassent l’intuition et les capacités humaines d’analyse et même celles des outils informatiques classiques de gestion de base de données ou de l’information. L’explosion quantitative de la donnée numérique contraint à de nouvelles manières de voir et analyser.
Actuellement, une grande quantité des données est générée à partir de différentes sources, telles que les smartphones, les ordinateurs, les capteurs, les caméras, les systèmes de positionnement global, les sites de réseaux sociaux, les transactions commerciales et les jeux. Étant donné que les données générées ne cessent de croître, des installations efficaces de stockage et de traitement des données posent des défis aux plates-formes traditionnelles d’exploration de données et d’analyse.
Quelques données sur la donnée
Entre 2000 à 2017, le nombre d’internautes a explosé de 400 millions à 3.7 milliards… presque la moitié de la population mondiale. Chaque minute, 18 millions de personnes veulent savoir quel temps il va faire sur ce laps de temps, 3.6 millions de recherches sont effectuées à l’aide de Google. L’infographie de la page suivante illustre bien ce phénomène d’intensification du Big Data : 4.1 millions de vidéos sont regardées sur YouTube, 69 444 heures de vidéos sont streamées sur Netflix, 527 760 photos sont partagées sur Snapchat et 46 740 sur Instagram… et 13 nouvelles chansons sont ajoutées sur Spotify.
Bracelets connectés, voitures autonomes, implants médicaux, caméras connectées, compteurs électriques intelligents ou jouets connectés sont autant de machines qui génèrent de plus en plus de données.
La capacité de recueillir et de traiter de telles quantités de données permet d’envisager une grande variété de produits et de services nouveaux. L’analyse des données peut ouvrir le chemin à des innovations incrémentales en permettant de mieux comprendre, voire de prédire à partir d’éléments existants, désirs et besoins des utilisateurs. Elle peut permettre de savoir comment les citoyens réagissent aux innovations qu’on leur propose ce qui renforce l’importance de la phase d’expérimentation (à condition de pouvoir faire les tests avec un nombre suffisant de personnes).
L’Open Data
L’open data, ou donnée ouverte, est une donnée numérique dont l’accès et l’usage sont laissés libres aux usagers. Elle peut être d’origine publique ou privée, produite notamment par une collectivité, un service public ou une entreprise. Elle est diffusée de manière structurée selon une méthode et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière.
Un nombre de plus en plus important de villes, de territoires, ainsi que l’Etat ont mis en place des démarches d’Open data. La France figure d’ailleurs dans les toutes premières places des classements européens sur le sujet (classement ePSI Forum).
L’ouverture des données publiques ne remet pas en cause l’importance des systèmes d’information, à savoir un modèle intégré qui puise sa valeur dans sa capacité à regrouper un grand nombre de données issues de systèmes hétérogènes au sein d’un seul et unique outil de pilotage. En considérant l’information publique comme un bien commun dont la diffusion est d’intérêt public et général, le mouvement Open Data ouvre le champs des expérimentations à tous les acteurs de la ville qui souhaitent résoudre une problématique ou améliorer des usages, et autorise la ville à tirer parti des dynamiques naissantes qui peuvent émaner de petites structures – telles que les startup – ou des citoyens. Ce qui distingue les deux approches, c’est la question du partage des données. Faut-il en limiter l’usage à quelques acteurs (les opérateurs de la ville intelligente) ou en promouvoir une appropriation et une réutilisation plus large par des tiers, entrepreneurs et innovateurs locaux ou nationaux ?
Approche intégrée et logique de partage des données, quelle tension ?
Le Grand Lyon restreint l’usage des données de mobilité à quelques acteurs sélectionnés, pour garantir que les applications développées ne «nuisent pas aux services commerciaux pilotés par la collectivité en délégation de service public». En clair, il s’agit ici de protéger aussi les intérêts économiques de l’entreprise délégataire, au détriment d’un accès au plus grand nombre.
Derrière la problématique de la gouvernance des données (modèle intégré vs. approche ouverte), c’est bien une question politique qui se pose : quel est le rôle de l’acteur public à l’heure de la ville intelligente ? Comment tirer parti des dynamiques naissantes sans pour autant abandonner toute souveraineté (numérique) aux opérateurs de la smart city ?
Les réseaux sociaux, gisement de données au service de la smart city (4)
Si la Smart City exploite pour le moment essentiellement les données récoltées par les capteurs physiques, les données des réseaux sociaux – souvent géolocalisées – pourraient constituer une autre source prometteuse pour comprendre la ville. L’avantage de ces données est double. Elles sont bon marché comparées à la pose de capteurs physiques et elles peuvent contenir une analyse de la situation, là où le capteur se contente d’une information quantitative sans analyse terrain.
Dès le début des réseaux sociaux, villes et habitants ont développé eux-mêmes leurs usages pour mettre ceux-ci au service de leur environnement. Ainsi, les collectivités utilisent quasiment systématiquement leurs comptes Facebook, Twitter, Instagram ou Snapchat pour relayer rapidement toute information utile aux habitants connectés (trafic, travaux, évènements, situations exceptionnelles). Quant aux habitants, ils se sont aussi appropriés les réseaux sociaux notamment pour créer des communautés dans leurs villes.
Certains réseaux sociaux l’ont bien compris et cherchent à faciliter le lien entre l’utilisateur et les informations liées à son lieu de vie.
De l’usage des données issues des réseaux sociaux
Prenons l’exemple de Facebook qui a mis en place du “service safety check” utilisé pour la première fois en France lors des attentats de Paris de novembre 2015 et qui s’est depuis généralisé. Citons également Twitter qui a été le relais du #portesouvertes lors de ce même événement tragique. On peut légitimement se poser plusieurs questions : quelle est la légitimité d’une entreprise privée à déterminer la gravité d’un événement ? Quand lancer cet outil afin qu’il ne soit ni trop tôt et ni trop tard et ne pas nuire à d’éventuelles actions de secour en cours ? ou encore est-ce bien avisé d’indiquer son domicile sur un réseau social entièrement public ? Certaines sociétés proposent de faire de la surveillance des réseaux sociaux («social media monitoring»). Cette activité permet aux entreprises de suivre la perception de leur image de marque mais peut aussi servir à surveiller les populations. Il est difficile d’obtenir des informations sur ce sujet. Les réseaux sociaux communiquent peu sur les données qu’ils rendent accessibles commercialement. Et les entreprises ou même les services de l’état qui utilisent ce type de prestation communiquent rarement dessus. Les données des réseaux sociaux constituent réellement une source intéressante pour rendre la ville encore plus “smart”. Mais la question de la protection des données et de la vie privée est centrale.
Data Analytics et prédictibilité
Dans toute ville, l’analyse des données est considérée comme la principale source d’amélioration des diverses thématiques “Smart city” visant à augmenter la qualité de vie des citoyens et rendre leurs villes plus durables.
Obtenir des informations à partir des données et prendre des décisions nécessite de nouveaux algorithmes et des techniques de visualisation qui modifient la façon de gérer la ville. Par exemple, les pertes d’énergie ou d’eau causées par des dispositifs défectueux peuvent être réduites en faisant correspondre la consommation mesurée par les compteurs des utilisateurs avec celle mesurée par les systèmes d’autres services publics. Ainsi, le traitement à la volée des données devient de plus en plus important, alors que les approches traditionnelles de stockage puis de traitement, dans lesquelles chaque entreprise récupère ses données et les stockent pour y accéder à l’avenir, peuvent ne plus être appropriées. C’est la notion de “time to market” tant utilisé dans les programmes de transformation des grandes entreprises notamment.
IA et deep learning
L’intelligence artificielle (IA) permet de transformer les données en ressources exploitables. L’IA transforme notre façon de capturer et d’analyser des données dans de nombreux secteurs allant de la sécurité publique à la gestion de la circulation automobile et du stationnement en passant par le maintien de l’ordre et les services municipaux. Par exemple, l’IA peut transformer la vidéo en informations précieuses : couplée avec le deep learning, elle fournit des analyses en transformant les données vidéo en informations utiles.
Protection des Données, Smart City : les clés de la ville aux mains des pirates ?
“L’autre facette obscure du big data utilisé dans les villes est celle de la centralisation des données et des menaces que cela peut poser pour la vie privée des citoyens”, Francis Pisani
Par le biais des plateformes web, des millions de données sont collectées. La garantie de la sécurité publique est primordiale. Pour contrer les éventuelles actions malveillantes, les collectivités doivent investir dans des systèmes informatiques ultra-performants.
À l’ère du Big Data, l’information sur les individus dans la ville intelligente est exposée à l’analyse, au partage et à l’abus, préoccupation grandissante qui suscite des inquiétudes quant au profilage, au vol et à la perte de contrôle de la donnée. Par exemple, de nombreuses données d’identification personnelle concernant les citoyens, telles que les activités sociales et les lieux, sont collectées et il convient de veiller à ce qu’elle ne soient pas utilisées à de mauvaises fins.
Cyber-sécurité et cyber-attaques
De nombreux efforts sont déployés pour répondre à cette préoccupation, et la sécurisation de la grande quantité de données privées collectées par les technologies des villes intelligentes auprès des pirates et du vol devient une problématique grandissante dans la Smart City. En effet, bien que les cyber-attaques réussies sur les villes restent relativement rares, les technologies des villes intelligentes soulèvent un certain nombre de préoccupations qui nécessitent l’attention de tous les acteurs, publics et privés.
Aucune ville ne peut se prévaloir d’être totalement à l’abris d’une attaque, et des pirates ont déjà infecté des réseaux électriques, le réseau du tramway à San Francisco, des systèmes d’alerte de Dallas. En avril 2017, le système d’alarme de la ville américaine de Dallas, qui compte 156 sirènes réparties dans toute la ville et qui est utilisé pour prévenir la population en cas de problème, a été piraté.
Les cyberdélinquants sont parvenus à les faire sonner une quinzaine de fois avant que les autorités de la ville ne parviennent à reprendre le contrôle, déclenchant un vent de panique dans la population et occasionnant une explosion du nombre d’appels au numéro des urgences.
On ne peut s’empêcher de penser à l’utilisation de tous ces jeux de données dans le cadre d’attaques terroristes
On peut imaginer également différents services paralysés par des cybercriminels qui auront infecté un réseau informatique avec un ransomware (virus chiffrant toutes les données d’un serveur ou d’ordinateurs) et exigeront le paiement d’une rançon pour tout débloquer.
Même en matière de Smart City, il faut respecter les règles fondamentales. Le chiffrement des communications de la smart City et le cloisonnement des données sont prioritaires. Mais surtout il est primordial d’intégrer la sécurité dès le début, notamment par le “Privacy by Design, d’un projet, car il est très compliqué de l’intégrer plus tard.
Privacy by Design
La protection intégrée de la vie privée (PIVP) (ou le respect de la vie privée dès la conception) en anglais «Privacy by Design», (PbD) est une idée développée durant les années 1990 par la Commissaire à l’information et à la protection de la vie privée de l’Ontario (Canada) Ann Cavoukian. Partant du principe que le cadre légal ne serait pas suffisant pour assurer la protection de la sphère privée, elle a proposé d’intégrer le respect de la vie privée directement dans la conception et le fonctionnement des systèmes et réseaux informatiques, mais également dans l’élaboration de pratiques responsables.
Le respect de la vie privée dès la conception signifie prendre en compte dès le début les exigences en matière de protection de la sphère privée/protection des données et intégrer les outils de protection directement dans le produit, au lieu de les ajouter ultérieurement sous forme de compléments.
Pour vivre heureux, vivons cachés
Dans la ville de demain, les capteurs seront potentiellement partout et, par essence, largement invisibles comme dans le cas de la reconnaissance faciale appliquée à la vidéosurveillance. Dès lors, la smart city est-elle compatible avec la data privacy ? Est-il possible de respecter la vie privée des individus sans entraver le développement de services innovants ? En réponse à ces questions, la Cnil a publié un cahier innovation et prospective intitulé « La plateforme d’une ville – Les données personnelles au cœur de la fabrique de la smart city ».
La Smart City est-elle synonyme de surveillance généralisée ?
la création de données urbaines est souvent le fait d’entreprises privées comme Waze/Google, Uber ou Facebook. Ils proposent des services gratuits en échange de données (qui ne connaît pas la fameux adage : “Si c’est gratuit c’est vous le produit”) qui sont souvent largement utilisés par nos concitoyens utilisés car ils présentent un réel intérêt. Malheureusement si ces acteurs produisent un service au public, ils ne relèvent pas du service public. Sauf exception, il n’y a pas de contractualisation avec une collectivité locale, une délégation de service public (DSP). “Les acteurs du numérique savent clairement tirer de la valeur de ces données mais quid de l’utilisateur qui en est coproducteur et des organismes publics ?” explique Valérie Peugeot, chercheuse au sein d’Orange Labs, membre de la Cnil et ancienne vice-présidente du Conseil national du numérique.
Pour arriver à cette meilleure réutilisation des données urbaines au service du collectif, la Cnil explore quatre scénarii dans son cahier. Le premier existe déjà, il s’agit de l’open data privé. Il s’agit de données qui sont réutilisées par les acteurs publics mais aussi, à partir du moment où elles sont en open data, par des sociétés privées pour créer de nouveaux services. Le deuxième concerne les données d’intérêt général augmentées. Les données ne sont plus anonymisées comme en open data – ce qui dégrade mécaniquement leur qualité – mais pseudonymisées, avant d’être livrées à l’acteur public. Le troisième scénario porte sur la création de plateformes d’accès aux données, des entreprises mettent leurs données au service du bien public comme par exemple le projet Opal (pour « open algorithm ») qui associe Orange au MIT. Enfin, le dernier scénario repose sur la portabilité citoyenne. Un principe introduit par le futur règlement européen sur la protection des données (RGPD) qui permet à tout un chacun de récupérer ses données sous un format ouvert et lisible.
Sources
- Wikipédia
- Francis Pisani dans son livre “Voyage dans les villes”
- numéro 25 de la revue urbaine Place Publique
- Domo.com “Data never sleep 5.0, how much data is generated every minute?”
- Energystream Wavestone “Smart cities quel usage pour les réseaux sociaux”
- Blog Sylvain Métille “Privacy by design, ça veut dire quoi?”
- L’Atelier BNP Paribas “Pourra-t-on encore êtr anonyme dans la ville de demain ?”
- CNIL cahier Innovation et prospective « La plateforme d’une ville – Les données personnelles au cœur de la fabrique de la smart city ».
- Source numéro 25 de la revue urbaine Place Publique