美国大数据及人工智能公司:Databricks, Inc.

4月 21, 202111:12:50
评论
583 2895字
美国大数据及人工智能公司:Databricks, Inc.

Databricks, Inc.创立于2013年,总部位于美国加州旧金山,在加拿大,英国,荷兰,新加坡,澳大利亚,德国,法国,日本,中国和印度运营,是一家大数据与AI公司,它与存储在公共云中的公司信息进行交互。

美国大数据及人工智能公司:Databricks, Inc.

Databricks, Inc.百科资料:

Databricks是2013年由加州大学伯克利分校(UCB)负责开发开源Apache Spark数据处理框架的团队创建的,他们为数据科学团队提供了一个统一的分析平台,以便与数据工程和业务部门合作构建数据产品。

Databricks公司还创建了Delta Lake,MLflow和Koalas,这是横跨数据工程,数据科学和机器学习的流行开源项目。Databricks开发了一个基于Web的平台以与Spark配合使用,该平台提供了自动化的群集管理和IPython样式的笔记本。 除了构建Databricks平台外,该公司还共同组织有关Spark的大规模开放式在线课程,并为Spark社区举办规模最大的会议-Data + AI Summit,前身为Spark Summit。

全球有5,000多家组织在使用Databricks。

Databricks产品:

Databricks开发和销售基于现代Lakehouse数据架构的云数据平台。 Databricks的lakehouse基于开放源代码Apache Spark框架,该框架允许用户对半结构化无模式数据运行分析查询。

Databricks的Delta引擎于2020年6月推出,它是一个新的查询引擎,它位于Delta Lake之上,以加速SQL处理并提高整体性能。它与Apache Spark和MLflow兼容,后者也是Databricks的开源项目。

2020年11月,Databricks引入了SQL Analytics,允许用户直接在数据湖上运行BI和分析报告。 分析师可以直接使用标准SQL查询数据集,也可以使用新产品连接器直接与流行的BI工具(如TableauQlik,Looker和ThoughtSpot)集成。公司将Databricks用作数据工作负载的集中平台,例如机器学习,数据存储和处理,流分析和商业智能。

目前Databricks提供四种产品:

  1. Delta Lake——开源的数据湖产品。Delta Lake是建立在Spark SQL和存储在Databricks文件系统中的Parquet文件之上的存储层。通过使用差异(delta!)文件和特殊索引,Databricks为它的数据湖添加了重要的功能,使其具有更高的性能、与传统关系数据库相同的事务管理特性和ACID兼容性。这意味着可以将新数据添加到湖中,然后立即进行有效查询。
  2. MLflow——帮助数据团队使用机器学习的开源框架。MLflow是集成到统一数据分析平台(UDAP)中的,但是可以在开源代码的基础上与其他平台进行集成。MLflow可以用来协助机器学习实验和模型管理,可以记录不同算法和超参数配置,以及应用它们生成模型的准确性。MLflow还定义了一个模型持久化格式,这使模型可以共享。
  3. Koalas——为Spark和Pandos创建单一的机器框架,简化使用这两种工具的工作;
  4. Spark——开源分析引擎。

其中,MLflow和Delta Lake是2019年10月份在阿姆斯特丹的Spark+AI欧洲峰会上发布的新产品。

Databricks的统一数据分析平台(UDAP)是一个基于云进行管理和优化的Spark服务,可以直接从亚马逊云服务上获得,也可以从Azure云上以微软支持服务的形式获得。最近,Databricks向UDAP添加了上述新的功能,使其性能超越了Spark、Notebook和其他基本功能。

Databricks产品的开源版本都可以直接在网上下载,但是怎么使用这些产品来为我们工作却并不是一件容易的事情。Databricks以SAAS的形式向客户提供产品,并且负责解决使用中遇到的所有问题。当然,“订阅”这些服务是收费的。

Databricks, Inc.融资百科:

  • 2013年9月25日,A轮融资,Databricks获得 Andreessen Horowitz 领投,Alfred Chuang(个人)跟投的1400万美元投资。
  • 2014年6月30日,B轮融资,Databricks获得 New Enterprise Associates 领投,Andreessen Horowitz和DCVC跟投的3300万美元投资。
  • 2016年12月15日,C轮融资,Databricks获得 New Enterprise Associates 领投,Andreessen Horowitz和SineWave Ventures跟投的6000万美元投资。
  • 2017年8月22日,D轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、Battery Ventures、Geodesic Capital和Green Bay Ventures跟投的1.4亿美金投资。
  • 2019年2月5日,E轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、Battery Ventures、CoatueMicrosoft等跟投的2.5亿美金投资。
  • 2019年10月22日,F轮融资,Databricks获得 Andreessen Horowitz 领投,New Enterprise Associates、T. Rowe Price、Coatue、Tiger Global Management等跟投的4.0亿美金投资。
  • 2021年2月1日,G轮融资,Databricks获得 Franklin Templeton Investments 领投,New Enterprise Associates、T. Rowe Price、Salesforce Ventures、Andreessen Horowitz、Tiger Global Management等跟投的10.0亿美金投资。

Databricks, Inc.历史百科:

  • Databricks创立于2013年,源自加州大学伯克利分校的AMPLab项目,该项目涉及制作Apache Spark,Apache Spark是在Scala之上构建的开源分布式计算框架。
  • 2017年11月,该公司通过集成Azure Databricks被宣布为Microsoft Azure上的第一方服务商。该公司深深扎根于开源,并启动了Delta Lake,这是一个开放源代码项目,旨在为机器学习和其他数据科学用例带来可靠性的数据湖。
  • Databricks于2020年6月收购了Redash,这是一个开放源代码工具,旨在帮助数据科学家和分析师可视化并构建其数据的交互式仪表板。
  • 2021年2月,Databricks与Google Cloud合作,提供了与Google Kubernetes Engine和Google BigQuery平台的集成。

Databricks, Inc.美股投资:

公司官网

等待Databricks, Inc. IPO上市。

【市场唯一港股终生免佣交易的券商】

尊嘉证券港股终身免佣+平台费1港币/笔=港股交易只需要1港币/笔,不论股数、金额;尊嘉证券美股交易终身免佣+平台费$1/笔,购买套餐$6.88/月,交易0佣金0平台费。

港股交易最划算的券商,没有之一!
立即开户
继续阅读
  • 美股之家千人QQ群
  • 群号:109568427
  • weinxin
  • 美股之家微信公众号
  • 公众号"美股百科"
  • weinxin
美股之家
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: