nouvelles

gouvernance des données, il est temps de briser les stéréotypes

2024-09-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

abaissez le seuil de gouvernance des données, abaissez le seuil permettant aux entreprises de faire bon usage des actifs de données et rendez la consommation des données d'entreprise plus pratique.

texte|xu xin youyong‍‍‍

éditeur|zhou luping‍‍‍

dans le passé, les middle offices de données étaient confrontés à certains défis et malentendus. avec des millions de dollars investis à chaque instant, le centre de données donnait autrefois l’impression qu’il était cher et lourd.coûts de construction élevés, est devenu une pierre d'achoppement pour les petites et moyennes entreprises disposant de petites quantités de données, mais en même temps, ces entreprises ont une forte demande en matière de construction et de gestion de données.

le plus gros problème est que l'évolution technologique rapide al’évolutivité des cadres de gouvernance des données d’entreprise soulève de nouveaux défis. un rapport de gartner souligne que d'ici 2028, 50 % des plateformes chinoises d'analyse de données et d'ia construites avant 2023 seront également obsolètes en raison du découplage de l'écosystème. le domaine de la construction de données appelle à une révolution.

récemment, peng xinyu, vice-président du groupe alibaba et pdg de lingyang, a souligné lors du forum spécial lingyang data×ai lors de la computing conference que les entreprises doivent achever la déconstruction des scénarios et la reconstruction des activités afin d'embrasser l'ère de l'ia. dans,le domaine des infrastructures de données ouvre également la voie à une vague de reconstruction.

en réponse aux problèmes de construction tels que le coût élevé et la difficulté d'expansion de la gouvernance des données dans l'industrie, le produit dataphin a été entièrement mis à niveau. la version agile nouvellement lancée est utilisée pour résoudre le problème des scénarios dans lesquels la quantité de données d'entreprise n'est pas importante. mais les données doivent être construites. dataphin peut évoluer et étendre le système d'architecture de données. il réserve un espace de développement pour la gouvernance des données d'entreprise, et le dataagent construit sur la base de grands modèles permet aux entreprises de faire bon usage des actifs de données.

01

la gouvernance des données est désormais

le concept le plus connu en matière de construction et de gouvernance des données est peut-être la plateforme intermédiaire de données.

il y a quelques années, la vague du big data a déferlé sur le monde et les entreprises pionnières de tous horizons ont attaché une grande importance à l'exploration de la valeur des données d'entreprise. en 2017, the economist a également mentionné dans un article de couverture :les données ont remplacé le pétrole comme ressource la plus précieuse au monde

à cette époque, un groupe d'entreprises pionnières qui avaient accumulé une grande quantité de données ont été les premières à comprendre l'importance de briser les silos de données au sein de l'entreprise et de gérer et traiter de manière centralisée les données internes d'une entreprise. le concept de « plate-forme intermédiaire de données ». " a émergé à cette époque et alibaba a servi de plate-forme intermédiaire de données. le proposant du concept a également pris l'initiative de construire un centre de données au sein de l'entreprise et de fournir des produits et services à l'entreprise. un groupe d'entreprises leaders dans les secteurs traditionnels considère également la construction de plates-formes de centre de données comme un point de départ important pour intégrer d'énormes actifs de données internes et exploiter pleinement la valeur des données du point de vue de la configuration stratégique et de la poursuite active du changement.

en outre, en raison de la grande complexité et de l'ampleur des données des premiers entrants, d'énormes investissements sont réalisés dans la gestion et la construction des données, et le cycle de construction est également relativement long. cela a suscité une certaine controverse dans l'industrie.par exemple, un initié de l'industrie a observé un jour que le centre de données nécessite un investissement important, que ses effets sont difficiles à quantifier et qu'il est difficile de le mettre en œuvre dans des entreprises de taille moyenne.

cette année, gartner a répertorié le concept de « plate-forme intermédiaire de données » comme une gamme de développement technologique progressivement obsolète dans le rapport « china data analysis and artificial intelligence maturity cycle ».

cependant, les vétérans du secteur estiment que la « plate-forme intermédiaire de données » ne peut pas être comprise uniquement au niveau des produits et des outils, et que la valeur de la « plate-forme intermédiaire de données » ne peut pas non plus être considérée uniquement à partir de la popularité du concept.

la plateforme intermédiaire de données est un concept et un modèle, ce qui signifie que pour une entreprise, les actifs de données constituent une partie importante des actifs de l'entreprise. pour cet actif important, les entreprises ont besoin d'un moyen d'intégrer les données et d'unifier le nettoyage, le traitement et la gestion pour former des actifs de données faciles à utiliser. "la personne mentionnée ci-dessus a déclaré.

gartner a également mentionné dans le rapport que, dans le cadre de la vague technologique actuelle, « l'infrastructure de données » liée au renforcement des capacités techniques telles que l'intégration des données, la gestion des métadonnées et la qualité des données est dans une période de croissance rapide. elle sera au cœur de l'analyse et de l'analyse des données d'entreprise. ai. une base réutilisable pour votre application.le concept représenté par « plate-forme intermédiaire de données » est toujours à la pointe du développement de l'industrie, et le niveau technologique continue également d'évoluer rapidement.

en outre,promouvoir la commercialisation des éléments de données au niveau politique national, permet également aux entreprises d'accélérer la construction de capacités plus complètes de gouvernance des données et d'applications.

le 1er janvier de cette année, les « dispositions provisoires sur le traitement comptable lié aux ressources de données des entreprises » (ci-après dénommées les « dispositions provisoires ») ont été officiellement mises en œuvre. les ressources de données des sociétés cotées sont répertoriées au bilan comme une nouvelle comptabilité. compte et font partie des capitaux propres. selon les statistiques du china securities journal, au 31 août de cette année, 39 sociétés cotées avaient divulgué des informations liées à la saisie de données dans leurs tableaux, pour un montant total de 1,357 milliard de yuans. pour de nombreuses entreprises, la question de savoir comment parvenir à une gouvernance mondiale des données et créer des actifs de données est même devenue une question incontournable.

le consensus au sein du secteur est que la raison pour laquelle ces entreprises leaders peuvent prendre l’initiative de mettre des actifs de données sur la table est indissociable de l’accent qu’elles accordent à long terme et en permanence à la gouvernance des données.

poussé par les politiques macroéconomiques et la vague technologique, le concept de développement commercial basé sur les données est devenu de plus en plus populaire, et de plus en plus d'entreprises ont pris conscience de l'importance des plateformes de gouvernance des données et de la construction d'actifs de données.

dans cette vague, les besoins des petites et moyennes entreprises ne peuvent être sous-estimés. par exemple, wang sai, vice-président de lingyang, a constaté que :les petites et moyennes entreprises ont de forts besoins en matière de gouvernance des données et de construction d'actifs de données. « la quantité de données des entreprises n'est peut-être pas très importante par rapport à celle des grandes entreprises, mais elle est complexe et diversifiée. ces entreprises doivent gérer ces données de manière légère.

cependant, ces entreprises sont confrontées à de nombreux problèmes dans leur parcours de gouvernance des données. « les petites et moyennes entreprises ne disposent peut-être pas de réserves de talents suffisantes liées au big data et n'ont pas beaucoup de budget pour investir dans le domaine de la gouvernance des données. un haut responsable estime que de nombreuses entreprises manquent également de compréhension de la construction et de la construction d'actifs de données. gouvernance des données.

sur la base de ces problèmes, lingyang a procédé à une transformation légère basée sur l'expérience interne de gouvernance des données d'alibaba et dataphin, une plate-forme intelligente de construction et de gouvernance de données créée pour servir les grandes entreprises clientes externes, et a lancé la version agile de dataphin.

existerdans la version agile de dataphin récemment lancée, l'architecture du produit est devenue plus légère, ce qui peut aider les petites et moyennes entreprises à démarrer la gouvernance des données à moindre coût.. prenons l'exemple des exigences des opérateurs. la version agile de dataphin est compatible avec les bases de données relationnelles. les talents en gestion de données d'entreprise n'ont pas besoin de maîtriser la technologie de pointe du big data. ils ont seulement besoin de maîtriser sql pour fonctionner. l'exploitation et la maintenance sont également très réduites, ce qui réduit considérablement le seuil de talents pour la gouvernance des données.

« le minimum dont une entreprise a besoin est d’investirtrois périphériques matériels, l'investissement est seulementdeux à trois cent mille yuansvous pouvez démarrer un travail de gouvernance des données basé sur la version agile de dataphin. "dong fangying, directeur général de la gamme de produits du système de données lingyang, a déclaré à digital intelligence frontline. cela signifie également que par rapport à la version précédente de dataphin avec des fonctions puissantes et une architecture complexe, la majorité des petites et moyennes entreprises ont désormais un choix de plus. .

02

la gouvernance des données, comment équilibrer l'actuel et le long terme

lorsque les entreprises disposant d’une petite quantité de données commencent à travailler sur la gouvernance des données, elles se posent une question : à mesure que l’activité se développe et que la quantité de données devient énorme, doivent-elles remplacer un nouveau système ? cela posera-t-il des problèmes pour la future gouvernance des données ?

par exemple, une grande entreprise de vente au détail nationale a rencontré"douleurs de croissance". en raison de sa vaste configuration commerciale,les besoins en données des entreprises sont devenus extrêmement complexes et difficiles à traiter

auparavant, ils ont construit de nombreux systèmes d'applications métier avec différentes fonctions basées sur les besoins réels de l'entreprise. cependant, à mesure que les entreprises développent plusieurs marques et plusieurs canaux, la quantité de données devient extrêmement importante. dans le même temps, il existe des dizaines de cheminées de données indépendantes pour différentes données commerciales dans différents systèmes. en outre, les différents secteurs d’activité ont des définitions de données différentes, ce qui rend la gouvernance des données extrêmement difficile.

la raison de cette situation est liée au manque de perspective de gouvernance des données à long terme dans les entreprises. les architectures de données précédentes étaient basées sur des besoins métiers isolés. le responsable des données dans cette entreprise égalementconsidérez la construction de centres de données comme une tâche à long terme, à cette fin, ils ont également élaboré un plan pour les trois à cinq prochaines années pour construire le centre de données de l'entreprise.

par coïncidence, le responsable des données d'une autre société de crédit à la consommation a également remarqué que les idées de construction de la gouvernance des données devaient changer. "auparavant, l'accent était davantage mis sur les données générées, les processus commerciaux pouvant être numérisés et les questions de conformité des données". , il a constaté que dans cinq ans, à mesure que la quantité de données d'entreprise augmente, l'idée traditionnelle de construction d'entrepôts de données ne peut plus répondre aux besoins de l'entreprise en matière de stockage, de gestion et d'utilisation des données.

il s'agit également d'un problème courant rencontré par de nombreuses entreprises en matière de gouvernance des données——comment l’architecture des données réserve-t-elle de l’espace pour les développements futurs afin de répondre aux besoins de plus en plus complexes en matière de gouvernance des données à l’avenir ?

sur la base de ce problème courant dans l'industrie, le produit dataphin de lingyang a lancé de manière innovante une nouvelle architecture du système de données. une de cette architectureles fonctionnalités principales sont l'évolutivité et l'évolution

pour faire simple, les petites entreprises peuvent choisir dès le début la version agile et peu coûteuse du produit dataphin, en fonction de leurs propres considérations. à mesure que la taille de l'entreprise augmente, celle-cile moteur informatique sous-jacent peut être étendu, mis à niveau librement et évoluer en douceur., pour répondre aux futurs besoins de gouvernance des données et aux besoins de développement commercial des entreprises. cela est dû à l’utilisation de la même architecture sous-jacente entre la version agile dataphin et la version native.

ceaide à répondre aux besoins plus complexes en matière de gouvernance des données à mesure que les données d'entreprise se développent. après la mise à niveau de la version agile vers la version r&d intelligente de dataphin, la base de données sous-jacente peut être étendue de bases de données relationnelles à des bases de données interactives et mpp, telles que starrocks, clickhouse, hologres, lindorm, impala et d'autres bases de données dotées de capacités analytiques et d'une puissance de calcul plus fortes. , prenant ainsi en charge la planification, l'exploitation et la maintenance de données plus dimensionnelles ainsi que d'autres tâches de gestion.

à mesure que l'échelle de l'entreprise s'étend, le support de données sous-jacent de l'entreprise peut être mis à niveau vers un moteur big data, et peut même être étendu pour prendre en charge l'intégration de lacs et d'entrepôts. "petites, moyennes et grandes, nous sommes tous soumis à un ensemble de structures de déploiement qui peuvent aider les entreprises à se mettre à niveau de manière transparente", a déclaré wang sai.

cela prend en compte les caractéristiques de développement à long terme de la gouvernance des données d'entreprise, et les entreprises peuvent choisir librement les produits appropriés en fonction de leur propre échelle de données et de leurs propres exigences en matière de gouvernance.

en outre, dans le domaine de la gouvernance et des opérations des données, les entreprises sont également confrontées à un autre problème majeur, que peng xinyu définit comme suit :le conflit entre personnalisation et rentabilité. les grandes entreprises optent souvent pour un déploiement privatisé en fonction de leurs propres besoins, mais cela entraîne également des coûts plus élevés. les produits cloud standardisés sont évidemment moins chers, mais ils perdent également la possibilité de personnaliser les configurations.

en réponse à ce problème, la solution de dataphin est la suivante :en plus du modèle traditionnel de locataire de cloud public et du déploiement privatisé, il offre aux entreprises un modèle « semi-géré »., vous pouvez non seulement profiter d'un environnement contrôlable exclusif, mais également profiter de la planification élastique du cloud public.

par exemple, certaines entreprises du groupe ont des exigences différentes en matière de traitement des données pour différents modules commerciaux ou sous-activités. certaines données financières et d'adhésion nécessitent des calculs locaux, tandis que d'autres données peu sensibles en matière de sécurité peuvent être téléchargées sur le cloud pour être reliées aux activités et au traitement des données du cloud.

ce type d'entreprise convient au modèle semi-géré. comparé au service « louer un appartement » du modèle de cloud public et au service « construire une villa » de déploiement physique indépendant, le semi-géré est similaire à."louer une villa", qui peut non seulement répondre aux besoins des entreprises qui souhaitent améliorer leurs capacités de traitement de données et avoir des besoins de personnalisation personnalisés, mais en même temps tenir compte des aspects économiques.

d'une manière générale, dans le domaine de la gouvernance des données et des opérations de données, dataphin s'appuie sur les années d'expérience systématique du groupe alibaba en matière de gouvernance des données pour fournir aux grandes, moyennes et petites entreprises de différentes tailles des solutions qui couvrent plusieurs types de moteurs et s'adaptent à un variété d’exigences environnementales. produits extensibles et évolutifs.

dans le domaine de la gouvernance des données, les entreprises entrent dans une nouvelle étape d’approvisionnement à la demande et de mises à niveau gratuites.

03

à l’ère de l’ia, comment rendre les données vraiment utiles

dong fangying a vu de nombreux projets de plate-forme de gouvernance des données, et elle a découvert un modèle si l'autre partie est une pure équipe informatique,aucun concept d'exploitation des actifs de données, le taux de réussite de tels projets n’est souvent pas très élevé.

si les données sont uniquement stockées dans une base de données, cela ne deviendra qu’un coût et un fardeau.« l’idée gravée dans nos os est qu’une fois les données construites, elles doivent être utilisées. » a déclaré dong fangying à digital intelligence frontline. par conséquent, lingyang attache une grande importance aux opérations sur les actifs. il ne suffit pas de regrouper les données, mais aussi de mieux les utiliser.

il existe un énorme fossé pour que les entreprises puissent faire bon usage des données. dong fangying a découvert qu'en apparence, l'entreprise disposait de données et que l'entreprise avait des problèmes. faire correspondre les deux résoudrait le problème, mais la façon de connecter les deux était confrontée à un test énorme.

pour les gens d'affaires,comprendre le business et comprendre les données sont deux choses différentes. souvent, le personnel des entreprises manque de réflexion sur les données et doit néanmoins se tourner vers des experts en données pour l'acquisition de données, ce qui entraîne d'importants coûts de communication et de temps.

dans le processus spécifique d’obtention des données, l’équipe chargée des données est également soumise à une forte pression. ils sont souvent confrontés à de nombreuses demandes de renseignements sur l'endroit où se trouvent les données, ce qu'elles signifient, comment elles doivent être utilisées et où elles doivent être utilisées. de plus, il n’est pas facile de trouver les données souhaitées parmi les énormes ressources de données.

cela reflète que les besoins en données des entreprises ne consistent pas seulement à obtenir un résultat de données spécifique du chatbot, mais impliquent égalementla nécessité de rechercher et d'utiliser des actifs de données internes en fonction des besoins de l'entreprise. dong fangying a mentionné un exemple spécifique : elle rencontre souvent des questions de la part des clients : le taux de conversion des opportunités commerciales de l'entreprise est faible. quel type de données peut résoudre le problème ?

le cœur de la résolution du problème réside dans le processus métier. revenez d'abord à l'entreprise et découvrez quelles personnes et organisations sont impliquées dans le problème et quels processus sont impliqués. ce n'est qu'ainsi qu'il sera possible de donner des conseils précieux aux utilisateurs. de renvoyer un résultat de données basé sur les données.

partant de ce point douloureux,cette année, ling yang a lancé le premier agent d'intelligence des actifs de données du secteur : dataphin·dataagent., grâce à la prise en charge de grands modèles, les utilisateurs peuvent personnaliser leur propre agent et le personnel de l'entreprise peut le mettre en œuvre plus facilement.fonctionnement en libre-service à lien complet, des questions aux idées, données et utilisation.