Nuvem guerras de aprendizado de máquina aquecer

aprendizagem de máquina é a próxima fronteira na inovação de Big Data. E a nuvem é a próxima fronteira dentro dessa fronteira.

Quase cinco anos atrás, o Google lançou o seu serviço de aprendizagem de máquina baseada em nuvem Prediction API. Em julho passado, a Microsoft lançou o seu serviço Azure Machine Learning (Azure ML) como uma prévia, e trouxe-o em disponibilidade geral em fevereiro. Que o serviço tinha (e tem) surpreendentemente boa integração com o código escrito na linguagem de programação R open source.

Estes eram interessantes movimentos de abertura, mas o enredo engrossou quando a Microsoft anunciou em janeiro sua intenção de adquirir Revolution Analytics, a entidade comercial dominante contribuindo para o projeto R open source e o desenvolvedor de uma versão de computação distribuída convincente de R (chamada Revolução R) que integra especialmente bem com o Hadoop.

Mas na semana passada, as luvas realmente saiu. Na segunda-feira, a Microsoft anunciou que completou a aquisição da Revolution Analytics. E na quinta-feira, a Amazon anunciou, finalmente, o lançamento de seu próprio serviço de aprendizagem de máquina nuvem: Amazon Machine Learning (Amazon ML). Agora, a corrida de três cavalos começou.

Amazon Machine Learning conecta ao S3, Redshift eo sabor MySQL do Serviço Banco de Dados Relacional (RDS) .; Google Prediction API pode ler dados do Google Cloud Storage e BigQuery;. A Microsoft suporta tanto a sua Mesa e serviços de armazenamento de Blob como fontes de dados, bem como banco de dados SQL, tabelas colméia em Hadoop e tanto OData alimenta e arquivos simples apontada por um URL Internet válido.

Três de um par perfeito; Qual deles você deve usar? Eles são todos bons ofertas, usando qualquer um deles será altamente vantajoso se você não está implementando a análise preditiva em tudo ainda, e as probabilidades são que você não é.

Todos os três provedores de nuvem reivindicar os seus serviços de aprendizado de máquina são baseados nas mesmas tecnologias que eles têm usado internamente. Amazon, é claro, tem usado a análise preditiva em seus negócios de comércio eletrônico praticamente desde o início. Google usa a lógica preditiva em seus serviços de busca principais. Microsoft faz o mesmo com o Bing, Xbox e outros serviços.

Em termos de fontes de dados, todos os três principais provedores de nuvem pública conectou seus serviços de armazenamento do núcleo, e um ou mais de seus produtos de banco de dados, para as ofertas de aprendizado de máquina

Chame-me, uma vez que os dados são lidos em todos os três provedores de apoiar a construção de modelos preditivos sobre ele. Eles também fornecem APIs para os desenvolvedores para enviar valores de variáveis ​​de entrada e receber um valor previsto para a variável-alvo. A atração de colocar tudo isso na nuvem é que qualquer aplicação cliente pode executar uma previsão, fazendo uma única chamada de serviço web.

Por exemplo, você pode construir um modelo correlacionando pontos de dados demográficos como sexo, renda, idade e profissão para a probabilidade de compra de um item específico. Com qualquer um dos serviços de aprendizagem de máquina os provedores de nuvem públicos “, você pode fazer uma chamada de serviço web, fornecendo os dados demográficos como parâmetros de entrada, e receber uma previsão de volta (um sim ou não, indicando se uma compra é provável) como um valor de retorno .

Comprar ao redor; Os serviços são diferentes embora. Por exemplo

Google Prediction API, fiel ao seu nome, é orientada para o desenvolvedor e não fornece nenhuma interface de usuário (UI) .; Amazon ML prevê apenas um único (e bastante opaco) algoritmo com o qual os modelos podem ser construídos. Microsoft e Google fornecem uma seleção de algoritmos, e Microsoft permite que o código R e Python, e pacotes, para ser usado como bem;. A Microsoft fornece um fluxo de dados de estilo fluxograma de pleno direito a ser construída em sua interface. Amazon só permite a especificação de um conjunto de dados de entrada, ea seleção de variáveis ​​de entrada e a variável de destino a partir do esquema do conjunto de dados;. Amazon ML, embora possa impor restrições algorítmica e de interface do usuário, é orientada por assistente e muito fácil de usar .

Star Trek: 50 anos do futurismo positivo e comentário social bold; Microsoft de Superfície all-in-one PC disse a manchete lançamento hardware de Outubro; Hands on com o iPhone 7, novo Apple Watch, e AirPods; Google compra Apigee para $ 625.000.000

Pesquisa diz …; Então, qual dos três grandes sairá vitorioso?

Amazon tem uma vantagem de incumbência dada a sua conectividade com S3 e a quantidade de dados armazenados lá por muitas empresas. Google, por sua vez, tem a vantagem de reputação de usar a aprendizagem de máquina mais inovadora em seus próprios negócios principais.

O serviço da Microsoft é provavelmente o mais sofisticado, flexível e bem ligado: é a única a oferecer integração com Hadoop e seu serviço de integração de dados, Azure Fábrica de Dados (detalhes aqui). E se a Microsoft pode fazer um bom trabalho articulada tecnologia Revolution Analytics ‘para o Azure ML (algo que não deve ser tomada como garantida), que poderia ser um verdadeiro rolo compressor.

No final, os clientes provavelmente vai usar o serviço nativo de aprendizado de máquina para a nuvem que usa com mais frequência para outras tarefas de processamento de dados. Se qualquer serviço pretende transcender esse lock-in dinâmico, ele vai precisar para integrar a aprendizagem de máquina dentro de uma oferta análise mais ampla.

Empresa social; LinkedIn revela a sua nova plataforma de blogs; Big Data Analytics; não é a idade de grandes OLAP;? Big Data Analytics; DataRobot visa automatizar baixo pendurado fruto de ciência de dados; Big Data Analytics; fundador MapR John Schroeder desce, COO para substituir

Para a Microsoft, o que significa amarrar Azure ML em poder BI. Google faria bem para estender sua integração API-BigQuery Previsão para ser recíproca, para que as consultas contra BigQuery poderia referenciar modelos de previsão de API através de uniões SQL. Amazon terá um tempo mais complicado, precisando trabalhar com fornecedores de BI de terceiros (como o Jaspersoft, Logi Analytics e Tableau) que podem ser executados em EC2. Mas a recompensa seria grande.

Isso vai demorar um pouco para resolver. Quando isso acontece, porém, a aprendizagem de máquina vai finalmente ter algumas costeletas de grosso da população, ea competitividade das empresas poderia mudar dramaticamente.

Agradecimentos especiais a Jen Stirrup por seu apoio e de pesquisa logísticos contribuições

LinkedIn revela a sua nova plataforma de blogs

É esta a idade de Big OLAP?

DataRobot visa automatizar fruto maduro da ciência de dados

fundador MapR John Schroeder desce, COO para substituir