Dropbox maakt het makkelijker om beeldbestanden en PDF’s terug te vinden
De beelderkenning distilleert teksten en uit foto’s en PDF-bestanden, waardoor die zoekbaar worden. Volgens Dropbox zijn er zo’n 20 miljard beeld- en PDF-bestanden opgeslagen in zijn clouddienst. Zo’n 10 tot 20 procent van die bestanden zijn foto’s of documenten, wat dus wil zeggen dat de nieuwe feature zijn nut zeker zal kunnen bewijzen.
Om te zoeken naar een specifieke foto of een bepaald PDF-bestand, moet je enkel een kernwoord of -zin intypen, net zoals je dat zou doen bij een zoekmachine zoals Google (of Yahoo Search, yikes!). Daarna zal je zoekopdracht de meest relevante resultaten genereren voor dat specifieke kernwoord of die specifieke kernzin.
Dropbox liet aan VentureBeat weten dat dit het meest intensieve project ooit was tot nu toe op het gebied van machine learning. Vooral PDF-bestanden stelden Dropbox voor een uitdaging, aangezien bestanden van meer dan één pagina veel meer tijd nodig hebben om verwerkt te worden dan een beeldbestand.
Momenteel werkt die automatische tekstherkenning van Dropbox enkel nog maar bij de Engelse taal, en enkel bij de bestandstypen JPEG, een statische GIF, PNG, TIFF en uiteraard PDF-bestanden. De nieuwe feature is trouwens ook niet beschikbaar voor alle gebruikers. Zo kunnen enkel de Professional-, Business Advanced-, en Enterprise-abonnees er gebruik van maken.