Comment constituer les datasets adaptés à votre projet de machine learning.
"Le développement de votre business s’appuie sur une application machine learning ?
Quelle est la performance actuelle de votre IA? Quel degré de précision doit-elle atteindre pour être utile? Quel taux d’erreur sera considéré acceptable par votre marché?
Comment gagner du terrain sur vos concurrents lorsque la quantité de data et le nombre d’itérations nécessaires pour entraîner votre modèle sont inconnus?
Le succès de votre stratégie dépend autant de la puissance de calcul allouée et des algorithmes choisis que des données qui les nourrissent.
Plus votre projet se veut performant, plus ses datasets se doivent d’être adaptés.
Les enjeux de la constitution de vos datasets
Si les jeux publics de données vous sont insuffisants, alors faudra trouver de nouvelles sources.
Heureusement, les solutions pour créer vos propre datasets à partir de données non-structurées sont multiples.
Votre choix dépendra de votre réponse aux questions suivantes: