noticias

gobernanza de datos, es hora de romper con el estereotipo

2024-09-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

reducir el umbral de gobernanza de datos, reducir el umbral para que las empresas hagan un buen uso de los activos de datos y hacer que el consumo de datos empresariales sea más conveniente.

texto|xu xin youyong‍‍‍

editor|zhou luping‍‍‍

en el pasado, las oficinas intermedias de datos enfrentaron algunos desafíos y malentendidos. con millones de dólares invertidos en todo momento, el centro de datos alguna vez dejó la impresión de que era caro y pesado.altos costos de construcciónse ha convertido en un obstáculo para las pequeñas y medianas empresas con pequeñas cantidades de datos, pero al mismo tiempo, estas empresas tienen una fuerte demanda de construcción y gestión de datos.

el mayor problema es que la rápida evolución tecnológica hala escalabilidad de los marcos de gobierno de datos empresariales plantea nuevos desafíos. un informe de gartner señaló que para 2028, el 50% de las plataformas de análisis de datos y de inteligencia artificial de china construidas antes de 2023 también quedarán obsoletas debido a la desvinculación del ecosistema. el campo de la construcción de datos exige una revolución.

recientemente, peng xinyu, vicepresidente de alibaba group y director ejecutivo de lingyang, señaló en el foro especial lingyang data×ai en la conferencia de computación que las empresas deben completar la deconstrucción de escenarios y la reconstrucción empresarial para poder abrazar la era de la ia. en,el campo de la infraestructura de datos también está marcando el comienzo de una ola de reconstrucción.

en respuesta a problemas de construcción como el alto costo y la dificultad en la expansión de la gobernanza de datos en la industria, el producto dataphin se ha actualizado por completo. la versión ágil recientemente lanzada se utiliza para resolver el problema de escenarios donde la cantidad de datos empresariales no es grande. pero los datos deben construirse. dataphin puede evolucionar y expandir el sistema de arquitectura de datos. reserva espacio de desarrollo para la gobernanza de datos empresariales, y el dataagent construido sobre la base de modelos grandes brinda comodidad a las empresas para hacer un buen uso de los activos de datos.

01

la gobernanza de datos es ahora

quizás el concepto más conocido de construcción y gobernanza de datos sea la plataforma intermedia de datos.

hace unos años, la ola de big data arrasó el mundo y las empresas pioneras de todos los ámbitos de la vida concedieron gran importancia a la exploración del valor de los datos corporativos. en 2017, the economist también mencionó en un artículo de portada:los datos han reemplazado al petróleo como el recurso más valioso del mundo

en ese momento, un grupo de empresas pioneras que habían acumulado una gran cantidad de datos fueron las primeras en darse cuenta de la importancia de romper los silos de datos dentro de la empresa y gestionar y procesar de forma centralizada los datos internos de una empresa. el concepto de "plataforma intermedia de datos". " surgió en ese momento, y alibaba sirvió como plataforma intermedia de datos. el proponente del concepto también tomó la iniciativa en la construcción de un centro de datos dentro de la empresa y el suministro de productos y servicios a la empresa. un grupo de empresas líderes en industrias tradicionales también consideran la construcción de plataformas intermedias de datos como un punto de partida importante para integrar activos de datos internos masivos y aprovechar al máximo el valor de los datos desde la perspectiva del diseño estratégico y la búsqueda activa del cambio.

también debido a la alta complejidad y gran escala de los datos de los primeros participantes, se realizan enormes inversiones en gestión y construcción de datos, y el ciclo de construcción también es relativamente largo. esto ha causado cierta controversia en la industria. por ejemplo, un experto de la industria observó una vez que el centro de datos requiere una gran inversión, los efectos son difíciles de cuantificar y es difícil implementarlo en empresas de tamaño promedio.

este año, gartner enumeró el concepto de "plataforma intermedia de datos" como un rango de desarrollo tecnológico gradualmente obsoleto en el informe "ciclo de madurez de la inteligencia artificial y el análisis de datos de china".

sin embargo, los veteranos de la industria creen que la "plataforma intermedia de datos" no puede entenderse únicamente desde el nivel de productos y herramientas, ni el valor de la "plataforma intermedia de datos" puede verse únicamente desde la popularidad del concepto.

la plataforma intermedia de datos es un concepto y modelo., lo que significa que para una empresa, los activos de datos son una parte importante de los activos de la empresa. para este importante activo, las empresas necesitan una forma de integrar datos y unificar la limpieza, el procesamiento y la gestión para formar activos de datos que sean fáciles de usar. "dijo la persona antes mencionada.

gartner también mencionó en el informe que bajo la ola tecnológica actual, la "infraestructura de datos" relacionada con el desarrollo de capacidades técnicas, como la integración de datos, la gestión de metadatos y la calidad de los datos, se encontrará en un período de rápido crecimiento y será el núcleo del análisis de datos empresariales. ai. una base reutilizable para su aplicación.el concepto representado por la "plataforma intermedia de datos" sigue liderando el desarrollo de la industria y el nivel tecnológico también continúa evolucionando rápidamente.

además,promover la comercialización de elementos de datos a nivel de políticas nacionales., también está permitiendo a las empresas acelerar la construcción de capacidades de aplicaciones y gobierno de datos más integrales.

el 1 de enero de este año, se implementaron oficialmente las "disposiciones provisionales sobre el tratamiento contable relacionado con los recursos de datos empresariales" (en adelante, las "disposiciones provisionales") los recursos de datos de las empresas que cotizan en bolsa se enumeran en el balance como una nueva contabilidad. cuenta y forma parte del patrimonio neto. según estadísticas del china securities journal, al 31 de agosto de este año, 39 empresas cotizadas habían divulgado información relacionada con la entrada de datos en sus tablas, por un importe total de 1.357 millones de yuanes. para muchas empresas, cómo lograr una gobernanza global de datos y crear activos de datos se ha convertido incluso en una pregunta que deben responder.

el consenso en la industria es que la razón por la cual estas empresas líderes pueden tomar la iniciativa en poner activos de datos sobre la mesa es inseparable de su énfasis continuo y a largo plazo en la gobernanza de datos.

impulsado por las políticas macro y la ola de tecnología, el concepto de desarrollo empresarial basado en datos se ha vuelto cada vez más popular, y cada vez más empresas se han dado cuenta de la importancia de las plataformas de gobernanza de datos y la construcción de activos de datos.

en esta ola, no se pueden subestimar las necesidades de las pequeñas y medianas empresas. por ejemplo, wang sai, vicepresidente de lingyang, vio que,las pequeñas y medianas empresas tienen grandes necesidades de gobernanza de datos y construcción de activos de datos.. "la cantidad de datos de las empresas puede no ser muy grande en comparación con la de las empresas líderes, pero es compleja y diversa. estas empresas necesitan realizar una gestión ligera de estos datos".

sin embargo, estas empresas enfrentan muchos problemas en su recorrido por la gobernanza de datos. "es posible que las pequeñas y medianas empresas no tengan suficientes reservas de talento relacionadas con big data y no tengan mucho presupuesto para invertir en el campo de la gobernanza de datos". gobernanza de datos.

sobre la base de estos puntos débiles, lingyang llevó a cabo una transformación ligera basada en la experiencia de gobernanza de datos interna de alibaba y dataphin, una plataforma de gobernanza y construcción de datos inteligente creada para atender a grandes clientes externos de empresas, y lanzó la versión ágil de dataphin.

existiren la versión ágil de dataphin recientemente lanzada, la arquitectura del producto se ha vuelto más liviana, lo que puede ayudar a las pequeñas y medianas empresas a iniciar la gestión de datos a un costo menor.. tomemos como ejemplo los requisitos para los operadores. la versión ágil de dataphin es compatible con bases de datos relacionales. los talentos de gestión de datos empresariales no necesitan dominar la tecnología de big data de vanguardia, solo necesitan dominar sql para operar. la operación y el mantenimiento también son muy pequeños, lo que reduce en gran medida el umbral de talento para la gobernanza de datos.

“lo mínimo que necesita una empresa es invertirtres dispositivos de hardware, la inversión es sólode doscientos a trescientos mil yuanespuede iniciar el trabajo de gobernanza de datos basándose en la versión ágil de dataphin. "dong fangying, director general de la línea de productos del sistema de datos lingyang, dijo a digital intelligence frontline. esto también significa que, en comparación con la versión anterior de dataphin con potentes funciones y arquitectura compleja, la mayoría de las pequeñas y medianas empresas ahora tienen una opción más. .

02

gobernanza del dato, cómo equilibrar el presente y el largo plazo

cuando las empresas con una pequeña cantidad de datos comiencen a trabajar en la gobernanza de datos, considerarán una pregunta: a medida que el negocio se desarrolla y la cantidad de datos se vuelve enorme, ¿necesitan reemplazar un nuevo sistema? ¿dejará problemas para la futura gobernanza de datos?

por ejemplo, una importante empresa minorista nacional se ha topado con"dolores de crecimiento". debido a su amplia distribución comercial,las necesidades de datos empresariales se han vuelto extremadamente complejas y difíciles de procesar.

anteriormente, crearon muchos sistemas de aplicaciones comerciales con diferentes funciones según las necesidades comerciales reales. sin embargo, a medida que las empresas desarrollan múltiples marcas y múltiples canales, la cantidad de datos se vuelve extremadamente grande. al mismo tiempo, existen docenas de chimeneas de datos independientes para diferentes datos comerciales en diferentes sistemas. además, diferentes líneas de negocio tienen diferentes definiciones de datos, lo que hace que la gobernanza de datos sea extremadamente difícil.

la razón de esta situación está relacionada con la falta de una perspectiva de gobernanza de datos a largo plazo en las empresas. las arquitecturas de datos anteriores se basaban en necesidades comerciales aisladas. el responsable de datos de esta empresa tambiéntrate la construcción del centro de datos como una tarea a largo plazocon este fin, también han elaborado un plan para los próximos tres a cinco años para construir el centro de datos de la empresa.

casualmente, el administrador de datos de otra empresa de financiación al consumo también advirtió que las ideas de construcción de la gobernanza de datos deben cambiar: "antes se hacía más hincapié en qué datos se generan, qué procesos de negocio se pueden digitalizar y cuestiones de cumplimiento de los datos". , descubrió que, de cara al futuro, a medida que aumente la cantidad de datos empresariales, la idea tradicional de construcción de almacenes de datos ya no podrá satisfacer las necesidades de almacenamiento, gestión y uso de datos de la empresa.

este también es un problema común al que se enfrentan muchas empresas en el gobierno de datos——¿cómo reserva la arquitectura de datos espacio para el desarrollo futuro para satisfacer necesidades cada vez más complejas de gobernanza de datos en el futuro?

basado en este problema común en la industria, el producto dataphin de lingyang lanzó de manera innovadora una nueva arquitectura del sistema de datos. una de esta arquitectura.las características principales son la escalabilidad y la evolución.

en pocas palabras, las pequeñas empresas pueden elegir la versión ágil y liviana de dataphin en una etapa temprana según sus propias consideraciones. a medida que la escala de la empresa se expande, la empresael motor informático subyacente se puede ampliar, actualizar libremente y evolucionar sin problemas., para satisfacer las necesidades futuras de gobernanza de datos y de desarrollo empresarial empresarial. esto se debe al uso de la misma arquitectura subyacente entre la versión ágil de dataphin y la versión nativa.

esteayuda a satisfacer necesidades de gobernanza de datos más complejas a medida que se expanden los datos empresariales. después de actualizar de la versión ágil a la versión inteligente de i+d de dataphin, la base de datos subyacente se puede ampliar de bases de datos relacionales a interactivas y mpp, como starrocks, clickhouse, hologres, lindorm, impala y otras bases de datos con mayores capacidades analíticas y mayor potencia informática. , apoyando así la programación, operación y mantenimiento de datos más dimensionales y otras tareas de gestión.

a medida que la escala de la empresa se expande aún más, el soporte de datos subyacente de la empresa se puede actualizar aún más a un motor de big data e incluso se puede ampliar para admitir la integración de lagos y almacenes. "pequeños, medianos y grandes, todos estamos bajo un conjunto de estructuras de implementación que pueden ayudar a las empresas a actualizarse sin problemas", dijo wang sai.

esto tiene en cuenta las características de desarrollo a largo plazo de la gobernanza de datos empresariales, y las empresas pueden elegir libremente los productos apropiados en función de su propia escala de datos y requisitos de gobernanza.

además, en el campo de las operaciones y el gobierno de datos, las empresas también enfrentan otro problema importante, que peng xinyu define comoel conflicto entre personalización y rentabilidad. las grandes empresas a menudo buscan un despliegue privatizado en función de sus propias necesidades comerciales, pero esto también significa costos más altos. los productos estandarizados en la nube son obviamente más baratos, pero también pierden la capacidad de personalizar las configuraciones.

en respuesta a este problema, la solución de dataphin es:además del modelo tradicional de inquilino de nube pública y la implementación privatizada, proporciona a las empresas un modelo "semigestionado"., no solo puede disfrutar de un entorno controlable exclusivo, sino también de la programación elástica de la nube pública.

por ejemplo, algunas empresas del grupo tienen diferentes requisitos de procesamiento de datos para diferentes módulos comerciales o subnegocios. algunos datos financieros y de membresía requieren cálculos locales, mientras que otros datos con baja sensibilidad de seguridad se pueden cargar en la nube para vincularlos con el procesamiento de datos y negocios en la nube.

este tipo de empresa es adecuado para el modelo semiadministrado. en comparación con el servicio de "alquiler de apartamento" del modelo de nube pública y el servicio de implementación física independiente "construir una villa", el semiadministrado es similar al modelo."alquilar una villa", que no solo puede satisfacer las necesidades de las empresas que desean mejorar sus capacidades de procesamiento de datos y tener necesidades de personalización personalizadas, sino que al mismo tiempo considera la economía.

en términos generales, en el campo de la gobernanza de datos y las operaciones de datos, dataphin se basa en los años de experiencia de construcción sistemática del grupo alibaba en gobernanza de datos para proporcionar a empresas grandes, medianas y pequeñas de diferentes tamaños soluciones que abarcan múltiples tipos de motores y se adaptan a un variedad de requisitos medioambientales. productos ampliables y escalables.

en el campo de la gobernanza de datos, las empresas están marcando el comienzo de una nueva etapa de adquisiciones bajo demanda y actualizaciones gratuitas.

03

en la era de la ia, cómo hacer que los datos sean realmente útiles

dong fangying ha visto muchos proyectos de plataformas de gobierno de datos y descubrió un patrón. si la otra parte es un equipo de ti puro,sin concepto de operación de activos de datos, la tasa de éxito de este tipo de proyectos no suele ser muy alta.

si los datos sólo se almacenan en una base de datos, sólo se convertirán en un costo y una carga."la idea grabada en nuestros huesos es que una vez construidos los datos, deben utilizarse", dijo dong fangying a digital intelligence frontline. por lo tanto, lingyang concede gran importancia a las operaciones de activos. no basta con agregar datos, sino también hacer un mejor uso de los datos.

para que las empresas hagan un buen uso de los datos, existe una enorme brecha. dong fangying descubrió que, en la superficie, la empresa tenía datos y el negocio tenía problemas. hacer coincidir los dos resolvería el problema, pero cómo conectarlos enfrentó una gran prueba.

para gente de negocios,comprender los negocios y comprender los datos son dos cosas diferentes. muchas veces el personal empresarial carece de pensamiento sobre datos y todavía tiene que recurrir a expertos en datos para la adquisición de datos, lo que enfrenta muchos costos de comunicación y tiempo.

en el proceso específico de obtención de datos, el equipo de datos también está bajo una gran presión. a menudo se enfrentan a muchas preguntas sobre dónde están los datos, qué significan, cómo deben usarse y dónde deben usarse. además, no es fácil encontrar los datos que desea entre los enormes activos de datos.

esto refleja que las necesidades de datos de las empresas no son solo obtener un resultado de datos específico de chatbot, sino que también involucranla necesidad de encontrar y utilizar activos de datos internos en función de las necesidades comerciales.. dong fangying mencionó un ejemplo específico. a menudo encuentra preguntas de los clientes: la tasa de conversión de oportunidades comerciales de la empresa es baja. ¿qué tipo de datos pueden resolver el problema?

el núcleo de la solución del problema radica en el proceso de negocio. primero, regrese al negocio y descubra qué personas y organizaciones están involucradas en el problema y qué procesos están involucrados. sólo de esta manera será posible brindar a los usuarios una orientación valiosa. de devolver un resultado de datos basado en los datos.

a partir de este punto doloroso,este año, ling yang lanzó el primer agente de inteligencia de activos de datos de la industria: dataphin·dataagent.con el soporte de modelos grandes, los usuarios pueden personalizar su propio agente y el personal comercial puede implementarlo de manera más conveniente.operación de autoservicio de enlace completo, desde preguntas hasta ideas, datos y uso.