��DataOps?��Ҫ��ʲô��

InfoQ
2022��8��28��10ʱ

�� | ��

�߻� | ��Ӿ�

2008 ��ҵĵ�һ�ݹ��Ask.com��п�ʼʹ�� Hadoop��ʱ��Ϊ�� Oracle ��Ⱥ�޷��ӵķ��˾��ò��л�� Hadoop�� Twitter ��ݹ��ʦ�ĵڶ��ݹ��У��ڵ�һ�߲��벢�ƶ��ʹ��ݸ�� Twitter �Ĳ�Ʒ��ܣ��֮Ϊ��ݡ��Ҹ�Ը��򵥳�֮Ϊ��ݡ�� 2008 ��Ŀ��ݵ��Լ��֤��θı��硣��Ķ��йؽ��ŷ��˾��Ӱ�� 2016 ��ѡ��£��ô��ܵ��ָı��ķǷ��塣

Ȼ��дʡ��ݡ�� 10 ��󣬴��ƺ�ֻ��˾��á��ڹ�ȣ��еĶ��ҵ��㷺ʹ�ô��ƶ��ǵĳɹ��й�� BAT ��Ĺ�˾�Ѿ��˴��ݵ��ͬʱ��Ҳ��ֽ��Ҫ�Դ��ݼ��Ϊ��ĳ��޹�˾��Ȼ�кܶ��ڴ��ʹ�õ�Ц��ź��ʵ�ǣ��ڴ��˾��˵��Ҫô��Ȼ��дʣ�Ҫô��ȷ��ʵ�֡��˵��ǣ�һ��ѧ��ǽ⿪��ͨ��˾��Ĺؼ�� DataOps��

�� DevOps ��Ƶ��ƣ��Լ�� DevOps ��Ƶ��ɫ��ݹ��ʦϣ��ݵ�ʹ�ò��ʵ��ҵ�ɹ��ķ��죬��ǽ��Ҫ�� DataOps �Լ�Ϊʲô��ÿ��Ҫ��л�ȡ��ֵ�Ĺ�˾��Ҫ��

ʲô�� DataOps

��ά��ٿ��ϣ�DataOps �Ķ��ǣ�

DataOps ��һ��̵��Զ��ɷ��Ŷ�ʹ�ã�ּ��ݷ��ʱ�䡣

ά��ٿ��ϵ� DataOps ҳ�� 2017 �� 2 �´��ϸ��һ��ѧ�ơ�DataOps �Ķ��϶��ʱ��ƶ��չ��ؼ�Ŀ��ǳ��ȷ��ݷ��ݷ��ڡ�

�� 2018 �� Gartner ��ݹ��У�DataOps ��һ�γ��ڡ�Innovation Trigger��ʼ�׶Ρ�� 2021 ��У�DataOps �Ѿ��ٷ�չ��Peak of Inflated Expectation��Ե�ˡ�ͬʱ��Ѿ��һ�� DataOps ��Ϊ��Ĵ��ݲ�Ʒ�Ĵ�ҵ��˾��õ��˷��Ͷ�ʵĴ��֧�֣��Լ��ɿ��Ϊ��ĵ� FiveTran �� AirBytes�� SQL ��Ϊ��ĵ� DBT�� Ե��Ϊ��ĵ� Astronomer �ȵȡ�

DataOps ��Խ��ݷ��ż��ʹ��ݷ��һ��򵥵Ĺ��ʵʩ�ɹ��Ŀ��Ȼ��Ҫ��˽��ݺ�ҵ��Ĺ�ϵ��õ��ʹ�ù淶�Լ�һ��˾��Ļ��DataOps ��ʹ��ݵ�Ч�ʲ��ʹ��ݵ��ż��˾��Ը��졢��硢��õؿ�ʼʹ��ݣ��ҳɱ��ͷ��ո��͡�

��ݵĴ��Ӧ�ÿ��Է��Ϊ AI��˹��ܣ�� BI��ҵ��ܣ��˴�� AI ��ָ��˹��ܹ��ܣ��ѧϰ��ھ��Լ��л�ȡ��ǰδ֪֪ʶ�ļ��BI ��Ǹ��ʹ��ͳ�Ʒ��ݻ��ܵ��򵥵ı��棬��⡣��֮��AI ʹ�ø��㷨��µĶ��BI ��ͳ��ǿ��֡�

��д AI / BI ��򲢲��ѡ��ڼ��Сʱ��һ�� TensorFlow ��ʶ��򡣻��ʹ�� Matlab ��һЩ��ݣ��ʹ�� Excel Ҳ��ʵ��Ŀ�ġ��ڣ�Ҫʵ��ʹ��֧��û��Ĳ�Ʒ��Щ��˾��ˣ��Ҫ�Ĳ��ֶ��

Dimensional Research ��һ��飨��ͼ��ʾ��֣��Ҫʵʩ��Ӧ�õĹ�˾��˵��Ϊ��ѣ�

ȷ�� ;
��Ƴɱ� ;
��ҵ�� ;
��Ŀ�ļ�ֵ ;
��ҵ��д��רҵ֪ʶ�� ;
�޸��ܺ�� ;
ѡ��ȷ��ݿ�� ;
��Դ�� ;
��пɿ�� ;
��Ŀ��ѵ�ʱ��Ԥ�ڵ�Ҫ�� ;
Ҫ��ļ��Ӧ��̫�� ;
��ŶԸ��ߵ��ݷ�� ;
��Դ��ɲ��Ϣ ;
��͵��ԡ�

�ȸ��ݷ��ʦ��һ��о��֣��ڴ��ѧϰ��Ŀ��ֻ�� 5��ʱ�仨�ڱ�д ML ��ϣ�� 95��ʱ�� ML ��Ļ��ʩ��

��о��У��ǿ��Ժ��׵ؿ��Ĺ��ʵ��ϲ��ڱ�д��롣��ʩ��׼��Լ��Ч��Ĵ��Ƿǳ��ʱ��ģ��Ҿ��Ÿ��ַ��ա�

�ڹȸ��о��У��ҵ�ǰͬ�� Jimmy Lin �� Dmitry Ryaboy�� Twitter Analytics �Ŷӣ��Ļ��ǵĴ󲿷ֹ��Ա��Ϊ��ݹܵ��ʵ��ϣ�DataOps ʹ�ܵ��Ĺ��򵥺͸�Ч��

DataOps Ŀ�깦��

DataOps ּ�ڼ��ʱ�䡣��ˣ��Ӵ��ܹ��ʹ��Ӧ�õĽ��ͨ��Ҫʵ��¹��ܣ�

��𣺰��ܹ��Ӧ�ó��۵ײ�Ӳ��ʩ��Σ��ϵͳ��Ӧ�ÿ��ٶ��򵥡��Ӧ�ó��Ӧ�û��Ѽ��Ǽ�Сʱ�� ;
��ά��ϵͳ��Ӧ�ó��Ŀ��չ�ԣ��ԣ��ӣ��ָ��Ϳɿ��ԡ��û��ص��ά��רע��ҵ��߼� ;
��ݵİ�ȫ�ԣ��ԣ��ƺͷ��ʿ��ơ��ݶ��һ��֧�ֶ��⻧�İ�ȫ��ܿصķ�ʽ��й��
��ã��û�Ӧ��ܹ�ѡ��Ҫ��ݵĹ��ߣ��Ҫ��ǺͿ��Ӧ�á�Ӧ��Բ�ͬ�� / ML / AI ��ܵ�֧��ϵ�ϵͳ�У�
��ͨ��Ⱥ��ݼ�أ��ɵؽ��ת��Ϊ��Ӧ�ã��ݳ�ȡ��ݷ��ˮ�ߣ��ݵ�ʹ��Ӧ�ú��ײ��ϵͳ��

��֮�� DevOps ��ӱ�д��뵽��·��Ⱥͼ��ӣ�Ӧ��ͬһ��ɣ��ѭϵͳ��ı�׼��ṩ��׼ CI��𡢼�ع��ʵ�ֿ��ٽ�� DevOps ��ƣ�ͨ��׼��ֿ��Կ��ٽ��Ĵ��ƽ̨��ݵļ�ֵ��

DataOps ��

DataOps ��Ҫ��Դ��ڿ��ٷ�չ�׶Ρ�� Facebook �� Twitter ��Ĺ�˾ͨ��һ��ר�ŵ��ƽ̨�Ŷӣ�Data Platform Team��Ӫ��ʵ��Ŀ��ǣ��ǵ�ʵ�ַ�ʽ��빫˾��е� Ops ��ʩ��ɣ��ͨ��ˡ��ǿ��Դ��ǵĳɹ��ѧϰ��飬��һ��ÿ�ҹ�˾��ʵʩ��ͨ�ô��ƽ̨��

Ҫ�� DataOps ��ͨ��ƽ̨��Ϊ��Ҫ��¼��

�Ƽܹ��Ǳ��ʹ�û��ƵĻ��ܹ��֧��Դ��չ�Ժ��ӪЧ�� ;
�� DevOps ��ʵ��Ҫ��Դ��ṩһ�µ� dev / test / ops ��е��ö��ʵ��ƽ̨��Ȼ��Ҫ ;
ʵʱ��ʵʱ��ƽ̨�б��Խ��Խ��Ҫ��Ӧ��ִ��ƽ̨��һ�ȹ�� ;
��棺MapReduce �Ǵ�ͳ�ķֲ�ʽ��ܣ�� Spark �� TensorFlow �ȿ��ճ�ʹ��Խ��Խ�㷺��Ӧ�ý��м�� ;
��ɵ�Ӧ�ó��ݹ��Ӧ�ó��ݹ��ڹ��ȣ��ӣ��־��¼֧�֣��ƽ̨��Ҫ��DevOps �ĳ��ʵ��Ӧ��Ӧ�ó��ݹ��Լ�Ӧ�ó��֮��Ľ��Ҫ�ܶ��Ĺ�� ;
��⻧�Ͱ�ȫ�ԣ��ݰ�ȫ�Լ��Ŀ��Ҫ��⣺��޷��޷�ʹ�á��ƽ̨ӦΪÿ��ṩһ��ȫ�Ļ��Ա�ÿ��˶��ʹ��Щ��ݲ��ÿ��Ȩ��֤��ˡ�
Dev �� Ops ��ߣ��ƽ̨ӦΪ��ݿ�ѧ��ṩ��Ч�Ĺ��ߣ��Է��ݲ��ɷ��Ϊ��ݹ��ʦ�ṩ��ˮ�ߵĹ��ߣ��Ϊ��ṩ��ݺͽ��ķ��

��ԭ�� DataOps Ӧ�ó��

��ԭ��У��ҵ�Դ��ϵͳ�ĺ��ǣ��Ҫ��ٸ�Ч��ͳһ��ʵ�ֶ�Ԫ�칹��Ӧ�ã��Ӧ��֧��ҵ��󣬲��Ӧ��ڡ�

��С�ͻ��˵��ϣ��ֱ��ڹ��ʹ�� DPaaS��Data Platform as a Service��伴�ã��ά��踶�ѡ�ͬʱ��д��Ӧ�ÿɹ��ο��ֱ��ʹ�ã��Ӧ�ÿ��֧��ҵ��ߡ��Ҫ˽�з��ҵ��ʵ�ֿ��Ǩ�ơ�

��ڴ��ҵ��˵��ڹ�� / ˽��Ͻ��ԭ��ƽ̨��ϣ��ͨ��׼��ά��Ӷȼ��ɱ��ͨ�� DataOps ��߼ӿ��Ӧ�õĿ��ٶȣ�ͨ��Դ��Լ��ϸ��ȵ��Դ��Դʹ��Ч��

��ڴ��ͼ��ҵ��˵��˽�� / ��Ͻ��˽�� Data Platform as a Service��ҵ��Զ��⻧��ʽ��ƽ̨��ظ��衣ͬʱ��ͳһ��ݿ��̼��׼��ݹµ��ݹ��ڲ��ż�Ӧ�ø��롢��Դ�Ʒѡ�� ROI��

��ʹ��ԭ�� DataOps ��ĵ��Ӧ�ó��

1��ݼ��ɺͽ��ѯ��

2��ʵʱ��չʾ��

3��Ӧ�ã�

4�� API ��

5��ѧϰģ�ͣ�

6��BI ��