行业动态 火狐体育app:流动存储 为大数据而生 - - 畅享网 来源:火狐体育最新官网登录入口 作者:火狐体育app 发表时间: 2022-12-02 09:54:45

  B2B的市场一直被看好,企业级移动应用市场一定会出现像淘宝、百度、腾讯一样伟大的企业,但是他们尚未证明自己。

  今天,美国B2B企业级移动应用领域上市企业已达50多家,还有10多家即将IPO;在国内企业级移动应用服务经过10多年的发展之后,先后经历了被业界认可、用户认可和资本市场认可三个阶段,尽管发展缓慢但却为后续的爆发蓄积了能量。

  2013-2014年,资本市场已经开始在企业级移动应用市场发力;BAT纷纷进入,不断拉低移动应用门槛;移动互联网的发展对传统企业产生了巨大的冲击,传统企业已经意识到移动互联网化势在必行。

  伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方面,数据从反应速率(Velocity)、种类(Variety)、量级(Volume)和价值开发(Value)四个维度均呈现飞速发展的态势;另一方面,组织基础架构中与数据管理相关的应用爆发式增长,带来高频I/O性能的尖锐挑战,数据层的压力甚至可能产生破坏式的影响。【详细】

  1984年迈克尔戴尔创立了戴尔公司。多年以来,戴尔一直致力于倾听客户的需求,提供客户所信赖和注重的创新技术与服务。作为全球领先的系统与服务提供商,戴尔在中国拥有近9,000名员工,为包括大型企业、政府机构、教育组织、中小企业以及个人消费者在内的广大客户提供服务。

  主持人:各位网友,大家好,非常高兴欢迎大家参加今天的戴尔据数据的社交排队,我是中桥咨询的首席分析师王丛,谈到据数据它已经不是一种趋势,已经是现在直接影响着各种行业的格局以及产业的核心竞争力和价值链分析的这样一个过程。今天我们有幸请到一个主讲嘉宾,他们都是在这个行业非常有影响力的。

  主持人:今天,首先让我介绍每一个在座的主讲嘉宾,首先我和大家介绍的是:Alvaro Del Pozo,是戴尔在东南亚地区,包括日本地区的市场副总裁,之后我们介绍一下戴尔东南亚包括日本地区存储的 范圣俭先生,还有戴尔软件集团大中华技术总监 高国辉先生;今天同时有三个最终用户,厦门航空公司信息安全主管 陈德全先生,中石化石油有限公司管理处处长 孙惠民先生,业之峰装饰股份有限公司的 魏建新先生。

  主持人:在我们进入了正式的互动平台之前,我们首先用两个比较简短的故事和大家深入浅出的分析一下什么是大数据,大数据和我们每个人的日常生活有什么样的关系,大数据如何给业务带来更大的价值,如果不能很好的利用大数据,又会给业务带来一些什么样的挑战。

  主持人:第一个故事看大屏幕,这是科比,科比是一个非常有名的篮球运动员,如果从科比的一组数据,也就是从得分率上来讲,他是全球在篮球手里面得分第二的。但是,如果从投篮的命中率来讲,他是在全球排第十的。从这样一组数据我们可以看到。如果业务是根据一组数据源去做这样的一个决策往往会带来的问题,或者我们的这个决策比较偏颇,或者是我们完全可以出现一种错误的决策,这从某种纬度来讲,也就是在大数据演进的过程中给业务带来了挑战。

  主持人:下面我们看第二个故事,也同样是在赛场上的另外一个明星,大家比较熟悉的是贝克汉姆这样的一个角色。他本身被称为足球先生,就是因为他的技能没人能超过,但是通过这样一种大数据的数据分析我们可以看到,每一次贝克汉姆下场的过程中往往会有一种现象,就是整体球员平均的表现水准并不是在一个峰值,这种过程中,每一个球队就要决定在什么样的一个时间点能够充分的发挥贝克汉姆他个人的表现能力,同时也能够发挥整体的一个表现能力。这种过程中,就要求能够对赛场的赛事进行实时的分析,快速的做这样的一个决断。

  主持人:如果从这两组故事来讲,我们说的一个故事就是在大数据里面我们有四个纬度:第一个在大数据演进的过程中,对数据的类型和数据的来源在不断增加,也就是第一个V;第二个V在数据演进过程中越来越多的半结构化和非结构化进入了数据分析;第三个无论是处理能力,和风险能力速度在不断提高;第四个如何结合这样一些给业务创造价值。因为今天我们是一个互动平台,首先我们跟大家分享的是我们目前在网上,IT的从业人员有1618个,网上人员通过网上的互动平台参加今天这样一个派对。与此同时,CIO里面有200多个,有很多以手机的形式参加,为了给大家一个非常好的互动平台,您可以登录这样的一些网站,可以把您关心的问题发给我们在座的每一个主讲嘉宾,我们会尽最大的努力答复您的一些问题。

  主持人:这个过程中首先我们给每一个主讲嘉宾5分钟的时间让他们谈一下,他们是如何看待在大数据演进过程中IT的挑战,他们又有什么样的一些战略和技术来应对这样一个挑战。首先,请Alvaro Del Pozo先生,从他的纬度跟大家解读戴尔是如何看待大数据演进过程中IT的挑战,戴尔本身又有什么样的一些战略和技术应对这些挑战。您好,您能分享一下戴尔公司如何处理大数据的转换,以及哪种技术和技术架构,还有关键的技术我们拥有的。

  Alvaro Del Pozo:首先,感谢主持人,也非常高兴参加这样一个聚会,我也非常高兴在中国能够参与这次活动。为什么说戴尔的商用市场组在讨论大数据呢?答案就是因为大数据现在是市场营销的未来,因为市场营销也是涉及到大数据,这是一个非常强大的兴趣,那就是我们在戴尔要利用大数据。我们现在有越来越多的能力来帮助我们的客户利用大数据来应对他们客户的一些挑战。因此,市场营销就是关于大数据的,这是我今天参加的会议。 现在我们看一下市场营销这些基本的大数据的机会,以及我们如何在戴尔利用大数据的。

  Alvaro Del Pozo:首先市场营销的总体内容,一个重要的数据方面,我看到数据可以说会在下一个十年内以500多倍的速度落增长。可以说,我们考虑这一点,和其他数据的一些内容看起来,我们IT的数据仅仅在下面十年内增加3%。所以,我们可以看一下,400%多的增长和3%的IT花费的增长可以说是一个巨大的对比,这也就是我们为什么要应用大数据来保留数据,管理数据,来利用这些数据获得更好的洞察,我们要向前发展。这是为什么我们相信戴尔能够跟进,能够在采取我们更多的技术给大家更好的服务。我们也代表了在市场上最先进的技术来保留数据、管理数据,来利用数据,来获得更好的客户的见解,能够让公司获得更好的洞察,能够去给客户提供更好的服务,而且能够有一个更好的个性化的这种参与为客户去提供服务。

  Alvaro Del Pozo:具体来说我们有很多公司,他们也开始针对用户的一些服务,同时我们也在迅速的进入我们的存储和其他的一些领域。在北京我们也宣布了我们针对中国的这么一个存储的产品。那么,我们可以说会改变这个存储的经济学,在中国的市场上,以及全球的市场上进行重大的改变。我们的这种才能,我们的这种巨大的解决方案能够让我们最佳的去利用存储,能够把你的数据以一种最具成本效益的方式进行存储,而且能够更快、更低成本的应用这些数据,我们以自动化的方式来进行。

  Alvaro Del Pozo:最后我想说,过去几年我们一直向市场能够提供最快的技术,能够让客户利用最新的存储、内存等方面的技术,我们能够去提供闪存,我们客户还在提供磁盘的存储,我们有成本优化的最新的技术,而且是最快的这种投向市场。我们同时也应用,而且来改善我们的这种能力,让客户能够管理他们的市场环境。

  Alvaro Del Pozo:最后,我们能够去提供产品,环境的这种安全性。随着数据的不断爆炸性的增长,在你们的机构内,以及在全球数据的巨大增长,可以说我们IT的预算却没有增长,所以我们要去考虑如何来去解决我们所面临的一些挑战,而且能够帮助大家去实现我们面临的大数据的机会。

  Alvaro Del Pozo:现在我们谈论一些大数据的机会。我们相信我们正在进入一个新的商业周期,那么这是在2010年开始的这一周期。回过头看100年前的情况,在1900年的时候,如果你是一个公司,如果你有一个工厂,你就拥有这个市场,你具有强大的市场力量,你就拥有这个市场。这一个良好的例子就是,比如像通用汽车,像GE,它们有工厂,它们在市场上的产品并没有什么差异化。那么,可以说在1960年,20世纪60年代我们就开始变化,就开始考虑这种分销,成为一个重大的区别,这是为什么沃尔玛成为一个巨头。那它的分销渠道以及人口搬向这些郊区,就可以说对公司改变它的服务客户的模型方面发挥了巨大的作用。那么,现在我们有这种全球化,还有物流的全球的运转。那么,物流可以说需要有强有力的发展。那么,我们有竞争对手,更具竞争力,我们在20世纪90年代进入信息化的领域,像谷歌、亚马逊等等公司就产生了,他们利用他们一些技术上的优势,特别是他们硬件和软件的技术做到与众不同。

  Alvaro Del Pozo:我想从2010年以来,我们正在进入一个20年的商业周期,这和过去是截然不同的,我们正在加速这一周期,制造业就不再是一个和别人带来差别的一个行业了。我经常告诉中国的客户,中国对全球来讲是在巨大的变化之中,分销不会给你带来先天的优势了。比如说可以在中国香港购买一些东西,它会很快的送给我,技术可以说没有什么区别了,当然我们现在有云的这种服务,无论是小的客户,大的客户大家都可以应用云的服务,现在我们正在向前发展。那么,机构如果能够做到与众不同,就是它如何能够利用大数据能够把他们一个很好的在线的定位能够给客户提供更好的服务,能够提供个性化的服务,以及跟客户进行个性化的互动,这也是一种挑战,但是这也是一个机会,对于我们全球的机构来讲,特别是对于中国的这些相关的机构来说。

  Alvaro Del Pozo:如果我们再去考虑这么一个背景,去看一下市场营销的应用,我们就看一下两年前我们的情况。我们可以说只有9%的预算花在IT上,那么,现在我们可以说在市场营销和全球的市场营销总裁和CIO可以说他们有很大的职位的重合,可以说大数据发挥了巨大的作用。我们需要去管理市场营销方面的更多的一些挑战。我也非常高兴的说,而且我会非常自信的说,我们戴尔的解决方案能够帮助我来使得市场营销能够有巨大的变化,以便能够适用客户的需求,可以说这在互联网时代是至关重要的。在过去可以说我们有巨大的转型,我们可以说在客户数据方面进行了很多的投资,可以说我们也有很多的商业模型能够来针对我们的客户让他们更好的利用与他们相关的信息。而且我们也不断的去开发新的应用,我们在基于云的应用上能够利用这些数据,能够去管理客户的生命周期。

  Alvaro Del Pozo:特别在他们和我们戴尔公司进行商业交流的过程中,我们在过去一年内IT的投资增加了3倍。可以说戴尔作为一名公司有巨大的变化,我们现在有足够多的能力和工具能够帮助大家,无论是在硬件方面,在安全方面,在管理你的环境方面。我们在市场上,我们的技术架构,我们的服务能够快速的改变你们机构的运转情况,能够让你们更好的拥抱这个新的时代,能够提高客户的价值,促进机构的成长。我们处于一个非常激动人心的时刻,无论对戴尔还是对中国来讲都是这样的。

  主持人:从刚才Alvaro Del Pozo讲的,他进到我们现在数据的增长两490%全球,IT整个开支只是3%,在这样一个演进过程中,一个非常大的问题就是如何在存储上去用这么少的预算处理这么大的快速增长的一个数据。我知道您本身是管理整个的东南亚,包括日本地区的存储,所以从您的观点,从存储经济学的观点如何戴尔应对大数据演进过程中的存储需求。

  范圣俭:未来下一个十年我们数据的平均年增长率是高达490%,我们的IT预算其实是六位增长,这个资金巨大的鸿沟,对我们每个CIO来说如何面对这个挑战,这是一个最大的难题。我们不能用老办法处理新问题,传统的存储面对的问题跟我们新的应用两个之间的差异就能够看出来也需要一个新思路解决这个问题。那老的存储跟新的存储有什么区别?存储在业界里面已经有二三十年,戴尔有一些核心的科技基本上没有变化。比如老的存储,这个技术已经存在30年了,我们的CPU有一个摩尔规律,性能每年都是翻番的增长,CPU跟我们存储之间性能的鸿沟这是一个矛盾,怎么去解决它?如何有一个新的科技解决这个问题。

  范圣俭:第二、如果大家使用过好的存储,因为戴尔不是一个新生力量,过去十年我们跟EMC已经有很多合作,我们了解老式存储给用户带来的挑战。每三年就要做一次升级,要买很多软件,你使用之后才知道原来有这么多问题,更不要说别的问题,比如数据跟设备之间的绑定,这对客户来说是一个很痛苦的事情,更不要从TCU的角度来看。

  范圣俭:如何有新的策略去应对这个新的挑战呢。就是三点:第一、如何拥抱最新的客户。闪存无疑是我们下一个十年里面存储这个技术里面最核心的一个变化,闪存并不是天生每一个闪存都是一样的,如何能够应用不同闪存技术的优点跟缺点,能够把优点都彰显出来,评比它的缺点,是它TCU最大化。所以,我们去年推出的纯闪存的解决方案,就能够让用户用它最好的性能,前所未有的性能以一个非常好的TCU让用户把它绝大多数的大数据,它的热数据里面移到存储上面去。

  范圣俭:另外,如何根据用户工作负载的不同,提供相应的存储方案。大家知道新的工作负载跟过去的工作负载有很大的区别。新的工作负载,有以云、大数据虚拟为中心的,跟过去的负载有不同,无论它信息的流量,还有大数据的4个V都是彰显它的不同,所以我们需要用新的方式解决数据带来的挑战。我们性能要求高,并且非常高可用的这些工作负载需要一个全新的,性能非常高的纯闪存的解决方案满足用户的要求。

  范圣俭:那么,那些大量的数据的存放以后,进入冷数据,冷数据如何存放,硬件角度来说,如何能够有一个又便宜,密度又很高的解决方案。另外,从新的存储形式,比如软件定义存储,这些新的方式,或者说如何能够天生的具备云的基层能力这样一个存储,这些都是我们新探索的一些新的解决方案去处理这些问题。当然,我们看到很多用户他还在中间,如何能够寻找一个性能和价格都是非常优秀的,效率非常高的这样一个解决方案。在这里面,虚拟化所带来的是一个非常好的契机,可以使我们在这个领域里面效率得到大幅的提升。所以,我们要考虑你的服务器已经做了虚拟化,你的存储也是必须要虚拟化了。所以,这个新的以存储虚拟化这种架构的存储才是能够更好的面对中间这一类需要传统IT的这种。

  范圣俭:所以,总体来说,戴尔希望提供的一个解决方案给用户是能够拥抱前面说的新科技,根据不同的工作负载,把我们软件跟服务有一个很好的提升,提供一个端到端的解决方案。这边我们过去几年的收购,这些都会看到我们在存储方案里面都会把它集成在一起。所以,用户看到这些在不同角度都可以看到。而且所有这些都秉承戴尔一贯的基因,就是没有隐性成本。比如我们的软件,每一个版本,它的软件的费用都是免费的,这个对用户来说是一个非常好的节省。所以,我们更享受不断的升级所带来的好处,而且这个是没有开放给我们的用户。

  范圣俭:所以,综上所述,我们在新的云时代也好,大数据的时代也好,从存储角度来说,我们不能够用老瓶装新酒,我们需要一个创造性的现代化的基础设施,然后提供一个真正高效率的解决方案给我们的用户。谢谢!

  主持人:非常感谢范先生,我们可以看到戴尔在存储上,第一个它是非常以革新性的架构应对未来数据中心对于存储如何可以去最大限度的优化它资源利用率这样的一些需求。但是,谈到大数据我们知道,大数据里面硬件它是基础架构,大数据创造价值的核心一个是数据库,一个是如何能够实现BI。现在我们想从高先生,从您的纬度看,戴尔如何在大数据的演进过程中让用户创造价值。

  高国辉:各位网络前面的听众大家好,我想软件在大数据里面扮演的角色,大数据是一个大量,而且是流量很快,然后数据形态非常多样,至少比起过去我们可能单一的结构化数据,到现在可能我们面对更多是半结构化,乃至于是一个非结构化的数据。这样一个处理过程里面,其实整个数据的产生以及我们对于前端业务的需求来看,其实我需要分析也是不同的数据类型。那还有在这么大量的数据里面,我怎么找到有价值的一个信息。那这个问题其实对于软件来说它有一个非常重大的挑战就是我怎么去在这个现有的这些不同的应用之中,不同数据里面把它做一个集成、整合,然后还能够维持这个业务的连续性。

  高国辉:尤其是当我们在做数据分析的过程中,其实很重要的也是我的业务不能中断,同时它所提取出来的一些新的数据,由于有新的一些媒体,像常常看到的一些微博、QQ,这些所谓的社群媒体上面的一些加入,真正的可能我们要去针对新的数据来源,比如说一些客服中心,它所收集到的这些客户的抱怨。就像我们前面提到,这个抱怨本身可能是一段文字,或者是一句话,我怎么去判断这个抱怨到底是对我哪个产品抱怨,还是对我的服务抱怨,还是我哪一个部门环节出了问题。其实过去来讲我们并没有能力去分析这样的一个日志,甚至有时候可能有一些数据存储在非传统的一些数据源里面。比如像Hadoop,这样不同的新型的数据类型,跟我传统的一些来自于关系型数据库,所谓的Oracle,DB2,戴尔在历经18次的收购,把戴尔的软件集团整并之后,符合大数据的一个解决方案,就涵盖了所有的信息全生命周期的解决方案。

  高国辉:我们解决方案里面,从数据的产生,即便原来在传统数据库里面开发验证的过程,以及项目的微调,当然这里面Tod(音译)扮演一个非常重要的角色,它不仅仅是连接传统的数据源,还可以连接跨所谓的异构数据,甚至非传统数据,这样让我们的使用者可以得到多方面的信息和整合。然后能够把数据抽取出来,做一个业务的延续性,然后做一个更好的提炼和分析。到最后我们有一个BI的模块,可以做这样一个数据的分析、展现,回馈到我们整个前端的一个用户本身对于业务本身的一个理解是否跟它所预期的一致,或者它的行销策略上面或者伸展策略上面做一些新的挑战。

  高国辉:但是,总的来说,大家说BI,成也BI,做的好也是BI,做不好就很悲哀。所以,其实一个好的解决方案,在这里面,我们戴尔所提供的是一连串的涵盖信息全生命周期的一个方案,最重要是我们能够搭配现在所有科目现有的系统,而不需要因为今天要做一个大数据的分析,变成我要把所有过去我做的系统全部推倒重来,不。这里面我们跟PDW等等业界的不同的这些数据仓库的主流架构我们都有一个合作,甚至我们在硬件上面也跟他们做一个验证,同时配合了很多的一些其他的服务团队,然后能够提供这样一个完整的BI的服务。

  高国辉:所以,本身软件在这个大数据的应用里面除了我有一个完整的解决方案之外,更是说戴尔在这边有充分的信心以一个单一的供应商来面对所有的应用系统的集成,来面对不管数据源是来自于什么样的一个部分,甚至你今天可能会有一些不同的集成、服务器部分的问题,我们戴尔软件都可以提供相应的解决方案,这是我们今天能够为大家带来的最大的价值。

  主持人:非常感谢高先生,Alvaro Del Pozo谈到戴尔在大数据演进过程中戴尔的一些战略,以及它整个端对端的一些技术组合。范先生从存储的纬度解读戴尔在大数据演进过程中对存储提出一些什么新的挑战。高先生从整个数据的生命周期一直到后面的过程中戴尔如何提供端对端的软件的解决方案。下面我们听一下从最终用户纬度怎么看待大数据业务过程给他们带来的价值以及在IT架构的挑战。首先有请陈先生代表厦门航空公司谈一下您对于大数据演进过程中对您业务的价值和挑战的一些观点。

  陈德全:大家知道航空公司,其实客户的这些信息资源对航空公司来说就是一笔财富。如何从定做,离岗这些系统里面,旅客沉积的这些信息分析旅客沉积的一些行为,包括比如旅客喜欢坐什么位置,喜欢什么样的舱室等于这些爱好,可以给旅客提供更好的服务的享受应该是非常重要的。作为厦航来说,我们也引进了一些BI的系统,然后对旅客的这些数据也做了一些分析,并且对整个航班运行的情况也做一些分析。然后我们厦航前几年跟中国民航大学合作开发了一个收益管理系统,这个系统其实就是对往年一些航班整个的数据进行分析,然后得出在哪一个时间段,哪一个这种航段,能够使航班的收益达到最大化。这个系统运行几年,对提高整个航空公司的收益起了非常大的帮助。所以说,在大数据时代,其实对航空公司来说也是一个挑战。我们下一步还希望戴尔能在这方面提供解决方案上的一些支持和帮助,谢谢!

  主持人:陈先生说的非常典型的大数据的应用,我们知道航空公司现在要做的是两个。一个是如何通过CRM,通过大数据的形式能够快速、主动的把一些活性数据收集起来,同时和他的运行数据做整合,提供资金链、物流链的回馈。下面有请孙先生从石化的角度和大家分享一下大数据对您有什么样的一些价值,部署大数据过程中您又有什么样的考虑?

  孙惠民:谢谢主持人,说到大数据,前阶段在戴尔的赞助下,在厦门有一个小型的研讨会,我曾经专门跟福建的一些CIO分享过我对大数据的认识。今天我想主要集中讲两点。第一个是大数据的建设,第二个是大数据的应用。

  孙惠民:大数据的建设方面,我觉得现在有一个比喻非常恰当,就是大数据之所以大只是因为云计算技术的出现以后才可以称之为大数据,否则自古我们已经形成了大量的数据,不能称之为大数据。所以,在这种情况下,我觉得一定要用好云计算这个工具。好比一个什么比喻呢?如果大数据是中国的高铁跟列车,那云计算一定是高铁列车的轨道。所以,我想我们在做大数据的应用和建设上面这一点一定要把握好。

  孙惠民:第二、大数据的应用。据个案例,大家都说是我们中华人民共和国开国元帅,他实际上在长期战争过程中就养成了用数据分析来指挥战斗决策的这个习惯。比如他在辽沈战役当中,战役打完了,抓了一批俘虏,参谋向他报告所有的缴获的物资、人员的整个过程中,他发现这个数据跟他以前的不一样,他就马上意识到,在俘虏当中一定是把的最高指挥官抓住了。但是,现在为什么战俘名单上没有这个指挥官呢?他就让他的参谋马上把他的长相特点分析出来,什么戴眼镜,比较白,湖南腔,一下就把的最高指挥官抓住了。这就说明数据摆在我们眼前,我们要有非常好的利用手段把它利用起来。

  孙惠民:所以,我想今天高老师,戴尔也在这里,前面戴尔三位都讲了大数据如何存储,软件开发方面都非常好,下一步我们在具体做这方面的时候,可能会请戴尔过来帮我们做一些辅导,或者看看后续我们能不能有更进一步深度的协作。谢谢!

  主持人:非常感谢孙先生。之后我们请业之峰的魏先生从您的纬度和我们大家分享一下,您如何看待商业智能以及大数据对您业务的价值?

  魏建新:谢谢主持人,谢谢戴尔今天给我们提供了这样一个机会,北京业之峰是一家全国的装饰企业,全国有23个直营的分支机构,还有90多个加盟商,我们每年要做大概一万个装修。那么,在这个过程当中,我们可能还需要把很多的材料集成商集成起来,还有一些我们有几十个品类,上百种的材料。所以,把这些东西加在一起的时候,对我们企业来讲,数据量非常大。所以,在企业范围内,这确实是一个大数据。

  魏建新:那么,我们是怎么做的呢?在三年以前,实际上已经第四年了,我们开始着手构建企业的私有云,基于这种企业的应用,前端的营销,一直到我们这些设计,到工程,到供应链,一直到我们售后服务整个一个过程都已经起来了。现在我们每年大概有1.5T的数据量的增长。现在我们平时日常当中用140多个BI图表和160多张二维表,就是报表来反映我们企业管理的状态,这是我们实际的一个情况。

  魏建新:那么,从这几年的应用来看,在数据访问的及时性方面我们采用了一个分布式结构和虚拟的技术来实现我们及时性方面的一个处理。因为我们也测算过,每年有上百万次的请求,有的请求确实对及时性的要求还是比较大,这是从技术方面。从数据来源来我们目前来讲,在管理的数据方面非结构化的数据占了90%左右,还有一些半结构,或者是非结构化的数据也是我们下一步要进行管理的一个主要的方向。那么,这些非结构和半结构化的数据包含了我们在设计过程当中大量的设计图,效果图,以及施工过程的状态图,这些都是我们一个非结构化的数据。还有我们针对每一个客户会有三次以上的一个满意度的回访的语音的数据。所以,基于这些内容,我们在做好我们自己结构化数据管理的同时,下一步我们会着力的进行半结构化和非结构化数据的管理,这就是我们的一个情况。谢谢主持人。

  主持人:前面我们无论是从长商,或者从最终用户,是从观点上和大家分享了。那在下一个环节更加精彩,因为在下一个环节,我们会产生这种对话效应。就是场内和场外的对话效应,一部分我们会结合在座的几个最终用户,他们实际的使用的一些案例做一个解读,他们有什么样的一些需求。与此同时,我们会让厂商从他们的观点看在未来的这样一些技术走势会有什么样的一个发展?在这样一个过渡的过程中,让我们用几分钟看一个短片,看具体的大数据在基础架构,在BI这个层面它对于技术有什么样的一个需求,让我们看短片。

  主持人:首先,非常高兴大家又回到了一个主会场,我们始终看到有1600多人在线。那在这种过程中,我们下一个环节主要是针对用户的一些解决方案和他们未来的一些需求和我们场内、场外的用户做一个互动,我们在场外的时间可能也选一些CIO发表你们的一些观点。

  主持人:我的第一个问题是给孙先生的,我们知道我们在场外的时间简单做了一个切磋,目前来讲贵公司下面有各种石油的远程站点1000多个,还有一些零售站点,目前您的销售额在400亿以上。存在一个状况是服务器基本饱和,您需要提高它资源的利用率,需要提高BI,也就是商业智能对业务的支撑能力,以及下一步大数据在CRM这样的部署,通过孙先生您给大家解读一下,在这样一个演进过程中,您评估架构和技术有什么样一些因素?

  孙惠民:谢谢主持人,在大数据的近来过程中,因为我们公司是属于一个传统型的企业,在中国市场还相当带有一定的垄断性质,所以对市场的反映敏感不是好像完全市场化的公司。所以,在整个这方面的新技术应用方面相对来说比较慢。但是,我们明年在整个IT建设方面,我主要突出抓三个重点。第一个重点就是就是对整个IT架构要进行优化,特别是它的技术架构。特别刚才您也提到,我们现在整个半层楼的机房都被服务器占满了,没有地方放了。所以,做云存储,云计算已经做了一个非常迫切的地步,这是IT架构的方面。

  孙惠民:第二个就是商业智能对我们营销决策的重要性。因为今年我们中石化总部提出要建设以客户为中心,提高服务型企业的效率。最近中石化总部宣布把下游板块放开,要拿出我们整个30%的股份跟民营合作。这就是为了吸引民营资本给我们注入活力。所以,在这种前提下,过去我们有经营分析,我个人感觉还是属于比较原始的一种状态。所以,希望通过大数据的建设以后,特别是通过我们BI的应用,把我们整个的智能决策水平提高一步。所以,我们企业的目标就是要由过去的职能管理到流程再到智慧管理打造一个流程型的企业,我们现在也非常推行大数据的应用。

  主持人:从孙先生来讲,好像目前短期要做两件事,第一,架构上要整合,第二、在整个BI,或者通过IT创造价值上面要增加力度投入。把这个问题转给范先生,戴尔如何看待像孙先生这样的一种非常典型的大数据在云环境的这样一个运作的需求?

  范圣俭:很多用户都有新的挑战,如何把传统应用和新的应用有一个新的解决方案来面对这些需求。那么,在存储这个方面,我们处理的是数据,所以我们会看数据主要是什么。如果像刚才孙先生所说的这种情况是整合,我们既有结构化的数据,又有非结构化的数据。如果用户希望上一些大数据的解决方案,除了BI,如果他也希望处理一些非结构化的大数据分析。Hadoop是一个非常好的解决方案,如何把Hadoop产生的数据,所带来的数据结构跟我们传统的结构化数据,BI所带来的数据整合在一起提供一个有价值的分析给我们企业的用户,就像Alvaro Del Pozo所说的市场部,或者享受层面如何能够用好这个数据。实际上一个新的解决方案能够整合这些方案在一起,我们戴尔的这些解决方案在技术架构领域还是软件领域都可以很好把这些整合在一起,所以我们利用端到端的优势提供整合的解决方案给用户。

  主持人:因为今天我们是一个派对,所以引入场外的一个CIO,让在座的主讲嘉宾解答你们的一些问题。现在我们联线场外的嘉宾。

  中大服装有限公司:大家好,关于刚刚提到的云平台,大数据应用,我个人有这么一个问题,未来应用不仅仅局限于使用用户,面对跨平台的数据整合,戴尔大数据解决方案有什么独特优势,谢谢!

  主持人:我重复一下这个问题,他主要的问题是认为目前来讲大数据其实不仅局限于企业的内部,面对跨平台这样一个环境,戴尔的解决方案有什么特色?现在我把这个问题转给许良谋,让许良谋解答在线CIO的这个问题。

  许良谋:大家好,我是许良谋,也是刚刚加入这个派对,也很荣幸有这个机会回答这个问题。事实上我觉得比如刚才那位朋友问的是一个很好的开始。何为大数据?是先问自己可能什么叫中数据、小数据,可能开始说大数据不只是某一个应用里面的数据,可能还有不同的应用孤岛,如何把它通过跨平台抓进来。不过这些思路只不过是一个开始,真正我们看国外一些大数据的应用,事实上甚至我们把一些外面的Facebook、Twitter、腾讯,或者微博、微信的东西也全部抓进来。所以,我觉得不只是说我们公司内部这种跨应用孤岛,还是数据孤岛的应用,甚至对外、对内的数据全部把它抓起来,如何把它弄出来。

  许良谋:所以,在这里基本上我们就是说,像刚才范先生也说过,看我们到底是哪一种做法,基本上如果我们现在看全球大部分的企业,当他们开始做大数据的时候,事实上他们都是对这个结构化数据,或者非结构化数据都要找出一些适合的方案。因为如果你硬拿一个VI的应用说我就是要全部数据让你吞下,这也不可能,如果说我就能够通过Hadoop把所有数据都抓过来。但是,虽然它能够应用所有数据,包括半结构化的数据,但是如果用它分析你的结构化数据,结果也不能让你满意。所以,我们看到大部分的企业都是并合的,有BI系统,有我们和英特尔等合作的一些Hadoop平台,把数据挂起来。

  许良谋:然后,最重要就是怎么样关心ELT这部分,因为在整个大数据里面,无论对各个数据孤岛,还是对外孤岛,如何把这个数据拿过来,在你的平台里面,中间拿过来的时候是不是需要清理呢?清洗呢,或者需要转换格式呢,进去的时候是不是要一定格式,因为你是放在BI里面,或者放在Hadoop里面。我给大家的建议就是划各个数据块的时候,不要低估ELT,因为这部分几乎是成败的一个关键,甚至有一些不成功的公司在大数据可能一直在做,也希望能够做恩完,但是还是停留在整个把这个数据从多个平台拿进来。所以,戴尔也是希望能够和业界我们自己,或者和外界这些专门做ELT特别成功、成熟的公司一起合作,把成熟的方案给客户。

  主持人:现在我要问第二个问题,谈到了大数据分析,或者是IT创造价值,其实很多用户最关心的一个是我数据库性能怎么保证?如何在大数据演进过程中既能保证数据库的性能,支撑我业务,给我业务一个很好的性能和安全性的支撑。这样的过程中我问的一个问题是问给厦门航空公司的陈先生,我知道数据库对你们来讲尤为重要,在您的演进过程中,您能解读在数据库的管理过程中遇到一些什么问题,对于未来的数据库,无论是保证性能和管理您有什么希望呢?

  陈德全:我们在数据库管理方面遇到的最大的问题和挑战就是数据的安全性。大家知道以前谈航空安全主要指飞行安全跟空行安全。最近几年,随着整个IT技术的发展,现在谈航空安全不仅仅是我刚刚说的飞行安全跟空行安全,把信息安全也列入了航空安全的一个范畴。所以,现在作为一个民航运输企业来说,就有三大安全主线,一个是飞行安全,一个是空行安全,再一个就是信息安全。刚刚说数据库管理方面遇到的最大挑战就是数据的安全问题,因为信息安全也就是包括这些数据安全。

  陈德全:大家知道这次马航事件,为什么整个搜索难度会非常难,到今天已经是第11天了,到现在还是没有任何消息,主要就是因为它在飞机上把两大系统人为关闭了,这些数据如果实时传递到地面,那么整个飞行的这种轨迹,作为地面航空公司来说应该是非常清楚的。首先数据飞行安全包括营销的数据,包括旅客的数据,所以,我们现在面临的挑战,比如说在数据库管理过程中怎么对数据库的管理做一些约束,做一些监控,做一些授权。怎么在敏感数据的传输过程中,如何进行加密,等等这些问题对我们来说都是一个比较大的需要解决的一些问题。所以,我们利用这个机会也希望戴尔有一些好的解决方案到时候可以给我们一些指导跟帮助,谢谢主持人。

  主持人:我们平常看到的数据库最重要,典型的几大问题。第一个就是刚才陈先生说的数据库的安全性。另一方面是数据库的性能。下面我想请魏先生,前面聊到魏先生在三年以前遇到很多数据库的性能问题,想从数据库性能的问题,魏先生和大家解读一下,您遇到什么样的一些问题又如何解决了这样一些问题。

  魏建新:我们抛开业务不说,单从数据来讲,我们关注的主要有两类,一类是技术性的问题,就是我们关心数据的准确、及时性、完备性。从完备的角度来讲,我们可能关注数据的安全性。基于这两种需求,作为技术人员,我们怎么能够在保证数据的准确性,及时性方面有所建树,其实是大家关注的一个方面。

  魏建新:对我来讲,我过去一直很崇拜于,或者很迷信在大机小机上做一些数据方面的东西,包括架构。我认为那时候Unix做小机是做最佳企业应用的一种组合。四年以前,我为什么要放弃的时候,其实也是源于我在工作当中遇到的一些问题,比如说小机扩容的问题,比如技术员的问题,比如出现问题以后恢复的问题,或者我的应用扩展带来的这种成本的问题等等,这些东西都被迫需要我去思考。怎么能在一定投资的条件下,这种大前提下,怎么能够把这种企业各种各样的应用。因为我们不知道今后会有什么样的应用纳入到我们统一的平台上,这是我们综合考虑的内容。

  魏建新:那么,经过这么几年,特别是像戴尔这些供应商的努力。实际上尤其是我觉得虚拟技术和分布式结构已经很好的解决了数据的及时性、准确性的问题,我觉得安全问题是一个尝鲜的话题,我相信没有一个企业能把安全性问题彻底解决,但是我相信随着技术的发展,安全性问题会越来越得到很好的发展,我看好这个发展前景。

  主持人:从前面两个用户可以看到,数据库里面,数据库的安全性,以及如何在大数据演进过程中,如何通过Unix、Linux,以及通过虚拟化,通过分布式来逐步提高数据库的性能,这是在大数据演进过程中。一则用户的需求也是得以验证。下面请高先生,您系一则对于数据库,二则对于BI是一个专家,从戴尔的纬度您怎么看在大数据演进过程中对数据的安全性以及性能的需求。

  高国辉:非常感谢两位嘉宾,一个谈到安全性,一个是效能,其实这像开车的时候一个是油门,一个是刹车。我们戴尔的解决方案,叫DBI(音译),或者是特权帐号,它在数据库也好,或者在应用,或者系统里面它的权限非常大,甚至可以把整个数据库一下子就关闭了。所以,对于这样一个帐号我们该怎么管,难道是我们管吗?那不是。所以,我们戴尔基本上提供的是所谓的一体机的概念,就是透过这个一体机,它是软硬件合在一起的机会,可以管理这个DBI帐号,每一次你进入DBI的时候提出申请,比如申请数据库的维护3个小时,这个密码有效时间就是这3个小时,过了这3个小时就没了。甚至在DBI通过我这个一体机连进去大后面的时候可以监控它操作的任何行为和数据,后面有一个摄象头把它所有的行为都录下来,甚至针对它所下的某一些命令关掉。

  高国辉:保证我的生产系统是安全的,可能它也不是有意的。类似这样的行为,我们就可以把它关掉。所以,这对于数据库的管理,所有这个系统里面来讲,刚刚陈总有提到,这个里面有一个问题,我们这个DBI很多时候通过IP做一个沟通,这个帐号和密码实际上是共享的,甚至可能明码写在城市码里面。所以,这时候我知道城市码一旦被打开,就肯到帐号跟密码,所以这对数据库的安全又是另外一个风险。所以,我们的解决方案就是我们可以允许我们的使用者,通过呼叫API,把真正的帐号和密码都绑在API里面。这样的访问,比如通过网络的应用,订票系统,其实真正看不到真正的数据库的用户名跟密码,这样就可以保护到我们数据的安全。

  高国辉:另外,数据库的性能上面,其实数据库作为一个数据集散中心,它前台有很多应用,有应用层,有Web层,所以它是所谓数据流的最后一站。但是,当他出现问题的时候原因就很多,有时候可能是因为前端用户可能看到的行为是我点击一个订票,发现响应时间很慢,但是有可能慢在数据库,有可能慢在应用,有可能慢在Web层。所以,这时候我们需要有一个完整的APM,这时候我关注的性能不是只有一个数据库,还有整个应用层,以及Web各个角度有可能发生的问题,有可能我应用代码写的不好,或者是我后面这个部分的数据库的确是产生了某些死锁,锁死等等的情况。我们需要有一套完整的监控工具,当我从端到端,从客户发起交易的Web端一直到最后处理数据的数据库这一端能够完整的去体现,去反馈每一个交易阶段。所以,我们戴尔针对数据库的安全和性能可以提供这样一个方式,保证让我们在整个企业运作过程中,油门顺畅,刹车安全。

  主持人:高先生讲的非常好,下面我们从网上的CIO介入,提出他们的一些问题,让在场的专家做一个解读。

  房地产集团的主管:数据库架构不断变化过程中,而且数据库某种纬度是一个多元化的过程,包括Oracle、以及Hadoop这样的一个过程,这样一个过程中,从戴尔专家的一个纬度,你们怎么保证在大数据演进以及数据库多元化这样一个过程中满足用户的性能以及管理效率的需求,可能我们先从软件的层面,回过头来以硬件的层面做一个解读。高先生,要不您先从软件层面解读。

  高国辉:软件就是保证所有业务的连续性,所以我们谈到BI,其实BI是一个作为最后数据的分析和解读。但是,它的部分,我们要求这个BI是要及时,又要符合弹性。既使是它需要这个时间落差达到最短,弹性是我要是能够加进来额外的一些数据源,可能今天从外部买了一些客户名单,这个客户名单一比对,现有客户数据是不是重叠,这跟我客户行为有什么不一样。所以,我又希望及时,又要快,又要弹性,其实就整个软件架构里面,我们就要很强调怎么能够做到实时的复制。为什么要做实时复制,因为当数据量大到某一个程度,没有办法既做交易,又做分析,又做查询,而且做交易、分析、查询所需要的配置是不一样的。所以,我们必须把这样的数据复制一份出来,复制过程如果能够达到秒级落差,这样就能满足客户在分析上面所谓的实时需求。

  高国辉:这样的实时需求,又会谈到一个所谓容灾的概念,又谈到一个双核的概念,如果做到双核,既可以满足用户需求,又能够满足业务的连续性,确保数据的安全,等于又复制一份出来。那复制一份出来,既可以分析一个复制出来的数据仓库,ODS,同时又可以连接一个所谓临时进来的外部数据,比如我访问的一个问卷的结果,这样我就可以很快的把这两个数据整合在一起,不需要把这个数据通过一个很繁杂的手续再进到这一个大的ODS。所以,这样就会满足客户对于分析上面的弹性。所以,这个软件来讲就是有一个复制,实时复制的概念,双核的概念,以及是不是有这个弹性可以同时连接不同的数据源,这个数据源可能是临时出来的一个文档,或者是文本这样一个架构,是非结构化的文件,我可以把它结合在一起,让它前端做一个分析展现。

  主持人:高数据您谈到更是在应用数据层面,谈到数据库来讲,我们一定要考虑它架构如何能够支撑这种数据库所需要的一个性能,我可能需要许先生,给您5分钟的时间,您的纬度,戴尔从IT架构上如何满足在大数据演进过程中数据库所需要的这种高可用性,高可靠性,以及性能。

  许良谋:其实我自己出身的时候是专门写大型主机,写应用,管数据库的,然后又慢慢从大型主机到消极,然后去到PC了。不过我发掘里面大家都有一个共同点,VBI只要硬件能够解决,他们都非常开心,因为他们不需要写更多的脚本了。所以,基本上在数据库的架构,硬件配合里面,其实我们主要就是说,是不是在硬件里面我们能够让它彻底把性能这一块,而且做性能的时候也把数据安全全部处理,油门和刹车一起做进去,如果硬件做到就无忧了。

  许良谋:所以,也是今天我们向大家宣布,戴尔的流动数据架构,以前我们就是存储管存储,但是现在我们也是把流动数据架构直接拉到主机这一端,我们把主机那一端的PCIE可以和后面全面的结合,因为这个PCIE是这么样靠近应用和我们的数据库,所以基本上它可以让我们所有的DBI通过这个架构就能够进入到一个全新的世界,无论是结构化数据,或者是Hadoop数据,因为我们都是面向虚拟化,或者是Unix,Linux平台我们都是开放的。所以,用这种前所未有的并行的架构还是照样能够继续撑下去。

  许良谋:另外,在数据保护方面,举个例子,如果您熟悉VMware,VMware其实为了保证虚机的长可用性,高可用性其实要用三个技术才能达到效果,但是有时候物理机挂了,你又用不了,就要用另外一个方案。所以,无论数据库还是其他应用,有的时候在背后硬件框架要三套不技术才能做到你要的双核,异地灾备,数据保护,累都累死了,可能还要请三批人做不同的事情。所以,我们戴尔想做的就是无论我们做的是双核,或者两地三中心,就是在双核之下,如果我们还能够做异地,灾备,而且统一性,统一管理,不需要用不同的管理机制,那不是更好,这不是整个数据库安全的最高级别吗。

  主持人:许先生讲的很好,高先生,许先生,如果回归到前面提到的可以看到,戴尔在数据库,无论是安全性和性能上有一整套的解决方案。软件层面从数据层、应用层,每一个层级上面都有自己的一组技术,而且考虑到目前作为BI层面有什么样的技术需求,在大数据演进过程中,你可能第一数据库会多元化,第二可能要支撑Hadoop。从硬件层面也可以看到,戴尔已经意识到这种传统的分层的管理会有很多弊端。第一、它非常复杂,第二、它会加大成本。所以,戴尔从某种纬度来讲,它是以逐步的体规工作负载为核心,保证高可用、高可靠、高性能这样一个过程。

  主持人:我们下面大家比较感兴趣的另外一个问题就是大数据的商业智能,这样一个问题首先想通过魏先生,您刚才提到了你们已经部署了BI,而且你的数据库是一个创新的,是以URL,加上分布式的虚拟化这样一个环境。我想通过您的一个经验跟我们大家解读一下,通过上了BI,给你的业务带来一些什么样的价值?在未来大数据演进过程中,你觉得你这样一些BI对你的架构和IT流程又提出一些什么样新的需求。

  魏建新:其实除了今天这种场合,过往还有一些场合,同样的问题提到我这里,说怎么看待BI的价值,说BI成功的标志是什么,怎么去衡量它。其实我对BI的感触最深,因为我觉得诸多系统当中BI是最复杂的,它的复杂性在于几个方面。第一、BI的适合人群是企业的高层,管理决策层;第二、BI的数据来源,因为BI本身是基于数据来源做的东西,从我们企业来讲,它是来源于很多。如果数据来源的及时性,或者准确性解决不了,BI出来的东西,它的可靠性就没有了。其实,我觉得BI是最后的一个体现,就跟我们做一个系统一样,我们做业务、财务一体化,实际上我们看财务的时候实际上看的不是财务,实际上我们看的是业务。BI同样是一个道理,我们通过BI就能看见我们在企业当中诸多的这种数据来源方面我们做的怎么样,这是我对BI的一个理解。

  魏建新:为什么我说BI不好做,或者扩展很大另一个原因就是BI当中其实不光是一个技术问题,更多是业务问题,或者是管理问题。就是你的模型怎么构建?这也是一个很大的问题。同样一件事情,模型不同,我们可能会得出完全不同的结论。举个例子,在我们企业当中以前没有做BI的时候,比如我们对基本上的一个数据,比如我们一个分公司的业绩,我们一个分公司的业绩包括三个来源。我们过去没有BI的时候就看哪个分公司某一年做了多少业绩,有了BI以后,我们就能从多个纬度考量它。

  魏建新:第一个纬度,这三个收入来源的比例合不合理?第二、人均贡献怎么样?第三、我们的成本构成是什么。还有一个就是也有一个卖场,我们单平米卖场的贡献率又是多少。其实我们不仅仅是从这几个方面,举个例子,光从业绩指标来看,就知道分公司这段时间它的运行情况和健康度怎么样。

  魏建新:那么,通过这些东西,我们其实有两方面的应用。第一个方面,我们通过数据分析,数据挖掘发现问题。第二、通过BI的东西,我们可能做一个对未来的预测,这是我们已有的东西。那么,对今后一个应用,我们主要是基于非结构化的一个数据在BI当中体现。那么,过去我们结构化的数据的分析结构,通常都是因果关系,比如说我通过一个什么,一定能得出一个什么来。那么,今后基于半结构化和非结构化的数据的时候,我们通过BI的分析,可能除了这些因果关系以外,更多可能是从关联关系,或者相关关系这个方面分析数据的一个作用,这就是我们今后在BI平台上要着力做的一些事情,谢谢主持人。

  主持人:刚才您提的非常好,现在我还是要提几个简短的问题,第一个刚才魏先生提到BI有两个环节,如何通过我们已有的数据做到精耕细作,也就是通过定量的数据,让你能够最大限度的无论是你资金链、物流链增加他的周转速度挣到更多的钱,这是一个环节。另外一个环节,在大数据的演进过程中,我们经常谈到可预测性,这种过程中,能够让你真正实现通过IT创造价值,你可以去预测市场上有哪样的一些技术,最大化你业务的可扩展空间。高先生,您的纬度,从大数据演进过程中戴尔有什么样一些技术来应对一则通过已有的数据实现精耕细作这样一个过程,第二在未来大数据演进过程中,如何保证用户持续把数字从传统的成本变成未来的黄金?

  高国辉:主持人跟魏总刚刚提到,BI能不能成功其实有一个关键,就是业务流程是不是真的能够被点到。这个过程其实牵扯到很多部门。BI能不能成功,高层能不能支持,有没有决心去做,其实是最重要的。BI的结果是否是一个可被解读,有价值的,如果这些数据是有问题的。这样就很重要的考验,我们在整个数据移动过程中,我们有没有一个比较好的展现方式,或者是一个分析的引擎来处理这样的一个数据。当然,对于传统的BI来讲,它除了我去分析一个数据,也就是所谓一个报表分析。如果谈到预测,它有某些演算法,到底未来是什么样一个状况。

  高国辉:我们这样讲,今天下雨,到底明天会不会下雨,如果我预测明天下雨是Yes或者是NO,如果我们预测明天80%下雨,这是概率的分析。过去我们可能直接通过报表就可以看到,是Yes或者是NO,但是影响天气的因素很多,但是我们慢慢会把BI的预测当做一个所谓的概率的分析,或者关联性的分析。慢慢其实我们市场上分析的不是说明天会怎么样的一个结果,而是如果当我做了这个决定之后,我买了这一杯水,同时间我会去买什么,我会去买报纸吗,或者我去买饼干,或者我买什么。所以,产生所谓搭售的一个概念出来。

  高国辉:所以,在我们BI的一个构建里面,其实我们的解决方案里面有所谓的报表,也有所谓的可视化。其实报表是一堆数据的组合,其实对报表最重要是如何让它可视化,可读化。所以,我们整个模块里面有很多图表的模板,可以帮助大家很快解读分析这样的一个数据。当然,如果谈到所谓的预测,它一定会有一个演算法,会有一个所谓的引擎的部分在里面。那我们戴尔收购的另外一个解决方案可以帮忙做这样一个分析、预测,以及关联性的预测。所以,对于未来BI的大趋势,其实加上大数据不同的类型之后,其实会更丰富,而我们的BI解决方案在这边已经准备好了。

  主持人:高先生非常感谢您的解读。下面我们做一个场外联线,找在线的CIO就您关心的无论是BI,还是大数据分析提出您的问题

  家具:在刚刚谈到的商业智能分析这方面,在商业智能部署过程中如何提高BI的效率,以及集成效率是我最关注的问题。请问戴尔软件解决方案如何同数据库,数据仓库和BI层面支持集成效率。

  主持人:主要他提到的是他意识到在整个BI过程中,ETL是一个重要的问题,如何提高ETL的效率,直接决定着BI整个的使用部署和使用效率。他想问到,戴尔从软件的整个数据库到BI上面有一个什么方案?高先生您给我们总结一下。

  高国辉:其实BI的分析来讲,我们会提到ETL,大家都非常重视这个In的过程,比如Input是什么,你要那些地方Input,我们做一个数据仓库要选择哪些数据源,这些有可能来自于关系型数据库,有可能来自于Hadoop,这是现在的趋势。首先,我们戴尔的解决方案可以帮助大家在数据第一步移动的过程里面,包含你不管是文本也好,或者是传播的RDBMS的数据也好,或者是你是一个Hadoop等这样的新型数据类型,我们都可以让它做一个移动。当我们做一个数据仓库的同时,其实我们并不是一下子就把这么多分散的数据源就放到数据仓库里面,而是我们经过一个过渡,叫做ODS运作的一个东西。

  高国辉:在这个里面我们做一个Load的过程,先把不同的下同丢到一个ODS里面,这个过程并没有做太多的数据转换,而是做一个复制过程,越及时越好,做这样及时数据的一个方法。进到ODS之后,我们才会来这边做所谓第二阶段的ETL,真正进入数据仓库,我们在这个数据仓库之上再做引擎的分析,包括BI的模块带给它的一个过程。所以,怎么提升这个效应,当然第一步最重要,因为你这个抽取,从这个Load过来就已经慢了,已经不准了,你后面的ETL就不用谈了。所以,戴尔除了硬件上面的快速,I/O的增大,在软件上面基于这样的优势怎么发挥硬件的作用,在某一个时间段处理更大量的数据。

  主持人:谢谢高先生,今年我们针对中国大数据做了一个调研,调研数据显示中国的用户,如何提高ETL效率是一个关键的瓶颈,您提到戴尔的解决方案能最大限度的减少在ETL环节的时间,你又提到在大数据演进这样一个BI的过程中,对于实时分析,对于存储方面要求非常高,范先生,您的纬度,戴尔存储如何应对大数据演进过程中BI对OLTP,OLAP的性能需求。

  范圣俭:刚才都跟大家从存储跟软件的纬度跟大家分享了,我们存储领域可以帮助广大客户在数据存储里面极大的提速。我们的一些技术可以非常显著的提升用户在数据库的效率,跑的非常快,现在我们从中国去美国坐飞机4、5个小时,如果一个飞机1个小时就到了,你觉得这个影响怎么样。同样过去的一个解决方案,出一个报表要跑一天,可能两天才能给你一次。但是,如果在你的算法,所有架构都没变的情况下,但是硬件可以让你提速,从过去10个小时变成1个小时,这对CIO意味着什么,你们用户的满意度是什么。以前可能想都不敢想,但是如果有一个解决方案让你提10倍,20倍,这意味着什么?这就是现在我们纯闪存技术带来的影响,就是不改变你的架构的情况下,我们如何可以非常大幅度的提升你的效率,这是第一个角度来说。

  范圣俭:第二个我们如何能够把这个门槛降低,让大部分的用户有机会用到,因为我们客户有些是很大的资金,他也愿意投入。那么,还有一些用户可能是广大中小型的用户,他也享受这个技术带给他的好处,这就是后发优势。我们今天发布的我们所谓的SE4000系列的这个产品,就是使我们纯闪存的技术到更低价位让广大用户用的起,这又是另外一个什么样的形成,这是第二个问题。

  范圣俭:第三个,我们刚才说的我们的技术架构可以使得这些数据都可以很快的去处理它,那么这个是两个角度。一个是我通过这个闪存技术,通过这些软件技术可以使得这些东西自动化,并且高效率的进行。然后,另外一个,我如何能够通过我们的技术,可以让很多存储供自身。举个例子,NAS的系统,非结构化数据的,传统的NAS不是横向扩展的,这意味着什么呢?你的数据到这么多的时候,你必定要重新做很多调整。如果是以一个可扩展的NAS系统,你对前端应用来说,只是写到一个Fluid里面不用变,你现在500TB也好,未来命名空间是不断拓展。这些都是我们如何在技术架构的角度来说拥抱新的科技,用我们里面的集成所带来的技术上的好处,可以使得你过去不敢想象的事情现在可以想了。

  主持人:刚才我们前面提的就是戴尔不仅有自己的软件能够保证无论是商业智能和大数据分析过程中,无论在数据库应用以及IT流程满足你未来发展的需求。与此同时,也在存储和IT架构上通过以存储结合一些新的技术,能够最大限度满足OLTD和OLAD的需求。现在我还有最后一个问题。最后一个问题就是我们在座的陈先生和孙先生,你们两个是非常典型的。陈先生是企业级的技术架构的搭建,孙先生是私有云的搭建,未来的架构谈的是永不宕机,在永不宕机的概念下面,陈先生您对于永不宕机这样一个架构有什么特别的需求,最后还需要孙先生做一个简单的解读。

  陈德全:其实这个话题,永不宕机我是这么认为。理论上来说应该是可以实现的,但是实际操作起来可能会遇到一些难题。我先介绍一下我们比较核心的系统。我们基本上是要提供7×24小时服务的。因为厦航现在目前来说我们基本上每天航班都是会到第二天两点左右,整个航班才结束。然后早班7:00又有航班了,那很多岗位上人员打击5:00就要开始为这个航班运行做准备了,所以很多系统在早上5:00一定要提供给大家用。所以,真正允许我们比如做系统维护也好,刚刚说宕机也好,只能允许大概2个小时到3个小时的时间,那是现在这种情况。

  陈德全:我们今年7月份又准备引进波音787,我们线小时在线的服务,我们要求系统不能有宕机。所以现在就是未来我们可能会考虑建异地的灾备中心,我们土建方面基本上已经在做了,准备在杭州,因为厦航在杭州有一个分公司,会在杭州建一个异地的灾备机房,按照预期,今年底就可以交付使用。那么,在本地我们也准备建一个信息大厦,也就是在靠近厦门机场的东边,市政府已经给厦航一块地,也算是支持厦航比较大的一个动作,因为基本上省市政府对厦航都比较重视,各方面的支持力度都挺大的。所以,厦门也准备再建一个数据中心。我们目前有一个数据中心,但是规模不是很大,可能总共面积才三四百平米左右,也基本上现在都快饱和了。那么,我们现在未来的考虑,就是两地三中心这样的方式。如果这个真正实施好,太有可能保证刚才说的永不宕机这样的一个话题。谢谢主持人。

  主持人:谢谢陈先生,其实我们谈到永不宕机,不是说硬件不能出问题,我们知道硬件、硬盘会出问题,永不宕机的概念就是无论是硬件,在设备层面甚至数据中心层面时间完全不受影响,刚才陈先生讲到两地三中心的做法。孙先生你可能做的方式是以云计算的 上一篇:大数据的存储方式 下一篇:大数据的存储

关注我们
©2022 火狐体育最新登录网址_官网app入口 京公网安备110177777720125 火狐体育最新登录网址|火狐体育app