Microsoft en SiSense brengen big data analytics naar Windows Azure cloud
In juni vorig jaar lanceerde Microsoft een nieuwe IaaS-optie (Infrastructure as a Service) op het Windows Azure-cloudplatform. Daardoor was het beter opgewassen tegen Amazon EC2 als een platform voor SaaS-oplossingen (Software as a Service). Aan de NoSQL-zijde voegden bedrijven als MongoLab en Cloudant Azure datacenters toe als deployment targets naast hun EC2-tegenhangers.
Tot die lijst met data service providers behoort vandaag onder meer ook SiSense, een bedrijf uit Tel Aviv. De combinatie van hun Prism BI en Big Data Analytics-technologie met Windows Azure heeft belangrijke gevolgen voor business intelligence (BI), big data, Microsoft, en de cloud in het algemeen.
[related_article id=”161452″]
Het aanbod
SiSense’s “ElastiCube”-technologie is een combinatie van een kolom-georiënteerde databank en een datavisualisatieplatform.
- Net zoals in-memory technologieën als SAP HANA, slaat Prism gegevens op in kolommen, om snel data te analyseren. Maar omdat SiSense gebruikmaakt van een hybride disk-and-memory-aanpak, draait het net zo goed op conventionele servers met conventionele (en meer betaalbare) hoeveelheden RAM. Een memory-only product als HANA heeft een veel krachtigere infrastructuur nodig.
SiSense Prism concurreert ook met producten als Tableau en Qlikview, die datavisualisatie en dashboarding aanbieden, gepaard met kolom-georiënteerde data engines. Maar Qlikview – net als Tableau wanneer de ingebouwde engine wordt gebruikt – bereikt veel sneller zijn limiet dan SiSense. Toegegeven, Tableau kan zijn data sources rechtstreeks queriën om die beperkingen te vermijden, maar dat maakt heel de zaak erg complex, zeker in de cloud.
- SiSense biedt licenties op basis van een abonnement, met een kostprijs afhankelijk van het aantal gebruikers. Je kan SiSense zelf installeren, op je eigen servers, op Amazon EC2 voor Windows, en nu ook op Windows Azure Virtual Machines. SiSense zal je in al deze scenario’s ondersteunen.
SiSense’s combinatie van een abonnementsformule en DIY-installatie is ietwat ongewoon. Meestal plaatsen SaaS-producten een zwarte doos rond de infrastructuur, en gebruik je een webportaal om je dienst in te stellen. Je kan SiSense aannemen om de installatie uit te voeren, maar de installatie is redelijk rechttoe rechtaan, zeker voor wie ervaring heeft met het instellen van virtuele machines in de cloud.
Naar de cloud en terug
Op Windows Azure heeft de DIY-aanpak enkele interessante gevolgen. Windows Azure VM’s zijn gebaseerd op hetzelfde formaat en dezelfde technologie als Microsofts Hyper-V on-premise virtualisatieplatform. Dat betekent dat je SiSense kan instellen in een lokale virtuele omgeving, om dan naar de cloud te verhuizen. Of je kan het omgekeerde doen. Of je kan beide doen door een VM image te klonen. Of je kan wispelturig zijn en regelmatig wisselen tussen cloud en datacenter.
Een probleem met BI en big data analytics in de cloud, is dat data in de cloud krijgen traag en moeilijk kan verlopen. Maar SiSense kan die gegevens heel snel lezen voor klanten die al gebuikmaken van Windows Azure, en (een deel van) hun data in Azure SQL Database – of SQL Server op een Azure VM – bewaren. En als de SiSense VM in hetzelfde datacenter als de source databank(en) wordt onderhouden, kunnen klanten kosten voor gegevensoverdracht vermijden. (Dat is althans toch mijn conclusie.)
SiSense biedt dus in-memory analytics, met on-premise-to-cloud en cloud-to-on-premise mogelijkheden. En omdat het geen zwarte doos SaaS-aanbod is, kan het voordeel halen uit data locality en de economische en prestatievoordelen die dat met zich meebrengt.
Wat zou Redmond doen?
Maar wat met Microsoft? Hun PowerPivot en Analysis Services Tabular mode engines bieden kolomopslag, in-memory analytics die vergelijkbaar zijn met SiSense, en de Power View-technologie die interactieve datavisualisatie aanbiedt is ook gelijkaardig aan SiSense. Maar Microsoft biedt PowerPivot en Power View niet aan als een dienst op Azure, en nu gaat het samenwerken met SiSense om een concurrerend aanbod aan te bieden. Wat gebeurt er?
Als we even het feit dat SiSense’s vice-president voor marketing Bruno Aziza jarenlang tot het BI-team van Microsoft behoorde, en dat moeten we doen, dan zijn er nog steeds een aantal belangrijke conclusies te trekken:
- Je kan op Windows Azure de meeste belangrijke NoSQL-databanken verkiezen boven Azure SQL Database, en je kan die zowel op Linux als Windows draaien. Je kan applicaties hosten die in een heel arsenaal aan programmeertalen (waaronder Java, Node.js, Python, en PHP) werden geschreven, niet alleen code gecreëerd in Microsofts .net-omgeving. En nu kan je dus ook concurrerende analytics-producten draaien. Waarom niet? Windows Azure wil een general-purpose infrastructuur zijn. Het moet dat doen om competitief te zijn.
- De Microsoft Data Platform Group, die voortkomt uit het SQL Server team, omhelst interoperabiliteit . Gebruik Microsofts analytics-producten met niet-Microsoft data sources, of gebruik niet-Microsoft analytics-producten met SQL Database en SQL Server als data sources. Je zal sowieso SQL Server-licenties of SQL Database-abonnementen of HDInsight/Hadoop-diensten nodig hebben. Dus dat zit wel goed.
Big cloud
Wat betekent dit voor big data analytics? Eerst en vooral gaan analytics mainstream, en kunnen ze betaald worden via abonnementen. Ten tweede worden analytics in de cloud erg praktisch, en kunnen ze samengezet worden met transactionele databanken in de cloud. Zo worden problemen met breedbandlimieten en latency verholpen.
Microsoft zet nog maar de eerste stappen in big data, en SiSense heeft minder dan 50 werknemers. De samenwerking lijkt onbelangrijk, maar heeft grote gevolgen.