100% DE RABAIS | Apprentissage automatique et Python et science des données


100% de réduction sur l'apprentissage automatique et Python et la science des données
100% de réduction sur l’apprentissage automatique et Python et la science des données

Obtenez un coupon Udemy à 100% pour le cours d’apprentissage automatique et de cours Python et science des données

Bonjour à tous et bienvenue à ce cours sur une introduction à l’apprentissage automatique

dans ce cours d’apprentissage automatique, nous aurons une introduction rapide à l’apprentissage automatique et cela ne sera pas très profond au sens mathématique, mais il aura une certaine quantité de déclencheur mathématique et ce que nous ferons dans ce cours d’apprentissage automatique couvrira différents paradigmes de l’apprentissage automatique et avec un accent particulier sur les tâches de classification et de régression et vous présentera également divers autres paradigmes d’apprentissage automatique. Dans cet ensemble de conférences d’introduction, je donnerai un aperçu très rapide des différents types de paradigmes d’apprentissage automatique et, par conséquent, j’appelle cela des conférences d’apprentissage automatique. )

Une brève introduction en mettant l’accent sur le droit bref, donc le reste du cours d’apprentissage automatique serait une introduction plus allongée au droit d’apprentissage automatique.

Alors, qu’est-ce que l’apprentissage automatique, je vais donc commencer par une définition canonique émise par Tom Mitchell en 97 et donc une machine ou un agent, je laisse délibérément le début indéfini parce que vous pouvez également l’appliquer à des machines autres que des agents biologiques, donc un agent est dit apprendre de l’expérience en ce qui concerne une certaine classe de tâches à droite et la mesure de performance P si les tâches de performance des apprenants dans la classe telles que mesurées par P s’améliorent avec l’expérience.

Donc, ce que nous obtenons de cette première chose, c’est que nous devons définir l’apprentissage par rapport à une classe de tâches spécifique, il peut s’agir de répondre à des examens dans un sujet particulier ou de diagnostiquer des patients souffrant d’une maladie spécifique.

Donc, mais nous devons être très prudents sur la définition de l’ensemble des tâches sur lesquelles nous allons définir ce droit d’apprentissage, et la deuxième chose dont nous avons besoin est d’une mesure de performance P à droite, donc en l’absence d’une mesure de performance P, vous commenceriez pour faire une déclaration vague comme oh je pense que quelque chose se passe bien qui semble être un changement et quelque chose appris est qu’il y a un apprentissage en cours et des trucs comme ça.

Donc, si vous voulez être plus clair sur la mesure de l’apprentissage ou non, vous devez d’abord définir une sorte de critère de performance.

Ainsi, par exemple, si vous parlez de répondre à des questions dans un examen, votre critère de performance pourrait très bien être le nombre de points que vous obtenez ou si vous parlez de diagnostiquer une maladie, votre mesure de la performance serait le nombre de patients que vous dites être le nombre de les patients qui n’ont pas eu de réaction indésirable aux médicaments que vous leur avez administrés peuvent avoir différentes manières de définir les mesures de performance en fonction de ce que vous recherchez et le troisième élément important ici est l’expérience correcte.

Donc, avec l’expérience, les performances doivent s’améliorer correctement et donc ce que nous entendons par expérience ici dans le cas de la rédaction d’examens, il pourrait s’agir de rédiger plus d’examens correctement, donc plus vous écrivez d’examens, mieux vous l’écrivez mieux. ou il peut s’agir d’un patient dans le cas du diagnostic de maladies comme plus il y a de patients que vous regardez, mieux vous devenez un bon diagnostic de la maladie.

Ce sont donc les trois composants, vous avez donc besoin d’une classe de tâches, vous avez besoin d’une mesure de la performance et vous avez besoin d’une expérience bien définie, donc ce type d’apprentissage là où vous apprenez à améliorer vos performances en fonction de l’expérience est connu comme ce type de apprendre où vous essayez où vous apprenez à améliorer vos performances avec l’expérience est connu sous le nom d’apprentissage inductif.

Et puis la base de l’apprentissage inductif remonte à plusieurs siècles, les gens débattent de l’apprentissage inductif depuis des centaines d’années maintenant et ce n’est que plus récemment que nous avons commencé à avoir des mécanismes plus quantifiés pour apprendre correctement. Donc, mais une chose que je signale toujours aux gens, c’est que si vous prenez cette définition avec une pincée de sel, vous pourriez par exemple penser que la tâche consiste à ajuster votre pied confortablement à droite.

Donc, vous pourriez dire si une pantoufle s’adapte confortablement à votre pied ou laissez-moi dire, je dis toujours que vous devriez prendre cette définition avec une pincée de sel, car prenez l’exemple d’une pantoufle que vous connaissez, donc la pantoufle est censée protéger votre pied droit et une mesure de performance pour la pantoufle serait de savoir si elle s’adapte à la jambe confortablement ou non ou si vous le savez, comme les gens disent qu’il se mord la jambe ou est-ce

Chaffin vos pieds à droite et avec une expérience que vous connaissez, car la pantoufle en sait de plus en plus sur votre pied tandis que vous continuez à varier la pantoufle pendant de plus longues périodes, il devient plus facile de bien ajuster votre pied, mesuré par le fait qu’il casse votre pied ou si ça vous mord le pied ou non.

Donc diriez-vous que la pantoufle est bien ajustée à votre pied par cette définition, oui, donc nous devons prendre cela avec une pincée de sel et donc tous les systèmes qui confirment cette définition de l’apprentissage ne peuvent pas être configurés pour apprendre généralement bien . (Reportez-vous à l’heure de la diapositive: 06:11) Donc, continuez donc il y a différents paradigmes d’apprentissage automatique dont nous parlerons et le premier est un apprentissage supervisé où vous apprenez une entrée à une carte de sortie à droite de sorte que vous recevez une sorte d’entrée. pourrait être une description du patient qui vient à la clinique et la sortie qui doit produire est de savoir si le patient a une certaine maladie ou non, donc cela a dû apprendre ce type de carte d’entrée à la sortie ou l’entrée pourrait être une sorte d’équation à droite, puis la sortie serait la réponse à la question ou ce pourrait être une question vraie ou fausse Je vous donne une description de la question que vous devez me donner vraie ou fausse comme sortie.

Et dans l’apprentissage supervisé, ce que vous faites essentiellement est sur une correspondance entre cette entrée et la sortie requise, si la sortie que vous recherchez se trouve être une sortie catégorique, comme s’il a une maladie ou non ou si la réponse est vrai ou faux, alors le problème d’apprentissage supervisé est appelé le problème de classification à droite et si la sortie se trouve être une valeur continue comme, alors combien de temps ce produit durera-t-il avant qu’il échoue à droite ou quelles sont les précipitations attendues demain à droite donc ce genre de problèmes, ils seraient appelés problèmes de régression. Ce sont des problèmes d’apprentissage supervisé où la sortie est une valeur continue et ils sont appelés problèmes de régression. Nous allons donc regarder plus en détail

la classification et la régression à mesure que nous progressons à droite, de sorte que la deuxième classe de problèmes est connue sous le nom de problèmes d’apprentissage non supervisés là où le but n’est pas vraiment de produire une sortie en réponse à une entrée mais étant donné un ensemble de données correctes, nous devons découvrir des modèles dans le droit de données. Donc, c’est plus de l’apprentissage sans surveillance des testicules qu’il n’y a pas de sortie réelle souhaitée que nous recherchons, nous sommes plus intéressés à trouver des modèles dans les données. Le clustering est donc une tâche, une tâche d’apprentissage non supervisée qui vous intéresse

pour trouver des groupes cohérents parmi le bon modèle d’entrée, par exemple, je pourrais regarder les clients qui viennent dans ma boutique à droite et je veux savoir s’il existe des catégories de clients, alors peut-être que les étudiants pourraient être une catégorie et les professionnels de l’informatique de couture pourraient être une autre catégorie et ainsi de suite et ainsi de suite et quand je regarde ce type de regroupement dans mes données, j’appellerais cela une tâche de clustering correcte.

Ainsi, l’autre paradigme d’apprentissage non supervisé populaire est connu sous le nom d’exploration de règles d’association ou d’exploration de modèles fréquents, où vous êtes intéressé à trouver une co-occurrence fréquente d’éléments directement dans les données qui vous sont fournies, donc chaque fois que A vient dans ma boutique, B vient également à ma boutique à droite. Donc, ce genre de cooccurrence, donc je peux toujours dire que si je vois A, il est très probable que B soit également dans ma boutique quelque part, vous savez, afin que je puisse apprendre ce genre d’associations entre les données. Et encore une fois, nous regardons cela plus en détail plus tard

ce sont, je veux dire, il existe de nombreuses variantes différentes de l’apprentissage supervisé et non supervisé, mais ce sont les principales que nous examinons, donc la troisième forme d’apprentissage qui s’appelle l’apprentissage par renforcement n’est ni de nature supervisée ni non supervisée et généralement ce sont des problèmes où vous apprennent à contrôler le comportement d’un système et je vais maintenant vous donner plus d’intuition

dans l’un des derniers modules, comme je l’ai dit plus tôt. (Reportez-vous à l’heure de la diapositive: 09:33) .Pour chaque tâche, vous devez donc avoir une sorte de mesure de la performance, donc si vous regardez la classification, la mesure de la performance sera une erreur de classification si généralement correcte.

Nous allons donc parler de nombreuses mesures de performance différentes pendant la durée de ce cours d’apprentissage automatique, mais la mesure de performance typique que vous voudriez utiliser cette erreur de classification est le nombre d’éléments ou le nombre de patients que j’ai incorrect, alors comment beaucoup d’entre eux qui ne souffrent pas de la maladie aujourd’hui prédisent qu’ils sont atteints de la maladie et combien d’entre eux souffraient de la maladie que j’ai ratée. Ce serait donc l’un des

les mesures que j’utiliserais et ce serait la mesure que nous voulons utiliser, mais nous verrons plus tard que, souvent, ce n’est pas possible d’apprendre réellement en ce qui concerne cette mesure. Nous utilisons donc d’autres formes à droite et de même pour la régression à nouveau, nous avons donc l’erreur de prédiction, supposons que je dis qu’il va pleuvoir comme 23 millimètres, puis qu’il finit par pleuvoir comme 49 centimètres, je ne sais pas, donc c’est une énorme erreur de prédiction à droite et dans termes de clustering c’est donc peu devient un peu plus difficile de définir des mesures de performance que nous ne faisons pas

savoir ce qu’est un bon algorithme de clustering car nous ne savons pas comment mesurer la qualité des clusters.

lire plus  Pratiques de programmation Java pratiques (120+ projets communs) - Cours Udemy gratuits

Donc, les gens proposent toutes sortes de mesures et l’une des plus populaires est une dispersion ou une propagation du cluster qui vous indique essentiellement la répartition des points qui appartiennent à un seul groupe si vous vous souvenez que nous sommes censés trouver groupes cohésifs, donc si le groupe n’est pas aussi cohésif, ils ne sont pas tous ensemble, alors vous diriez que le regroupement est de moins bonne qualité et si vous avez d’autres façons de mesurer des choses comme Alec vous le disait, donc si vous savez que les gens sont des étudiants de niveau collégial à droite et alors vous pouvez comprendre que combien quelle fraction de votre groupe ou des étudiants de niveau collégial.

Donc, vous pouvez faire ce genre d’évaluations externes, donc une mesure que les gens utilisent couramment est connue sous le nom de droit de pureté et dans l’exploration des règles de l’Association, nous utilisons une variété de mesures appelées soutien et confiance qui nécessitent un peu de travail pour expliquer le soutien en toute confiance afin Je vais le reporter et j’ai parlé des règles de l’Association en détail et plus dans les tâches d’apprentissage par renforcement, donc si nous nous souvenons, je vous ai dit qu’il apprenait à contrôler, donc vous allez avoir un coût pour contrôler le système et la mesure ici est coût et vous le feriez

tiens à minimiser le coût que vous allez accumuler tout en contrôlant le système. Ce sont donc les tâches de base de l’apprentissage automatique. (Reportez-vous à l’heure de la diapositive: 12:11) Il y a donc plusieurs défis lorsque vous essayez de créer une bonne solution d’apprentissage automatique, donc quelques-uns de ceux que j’ai énumérés sur cette diapositive à droite la première est que vous devez penser à quel point est un modèle que vous avez bien appris, donc j’ai parlé de quelques mesures sur la diapositive précédente, mais souvent celles-ci ne sont pas suffisantes, d’autres considérations pratiques entrent en jeu et

nous allons examiner certains d’entre eux vers vous, il y avait un milieu du cours d’apprentissage automatique quelque part à droite et la majeure partie du temps serait consacrée à répondre à la deuxième question qui est de savoir comment choisir un bon modèle. Donc, étant donné une sorte de données qui sera l’expérience dont nous parlons, étant donné cette expérience, comment choisirais-je comment choisir un bon modèle qui apprend en quelque sorte ce que je veux bien faire, comment cela s’améliore avec l’expérience, etc. alors comment choisir ce modèle et comment trouver les paramètres du modèle qui me donnent la bonne réponse.

C’est donc ce sur quoi nous allons passer une grande partie de notre temps dans ce cours de Machine Learning, puis il y a tout un tas d’autres choses auxquelles vous devez vraiment répondre pour pouvoir créer une machine utile. comme ai-je assez de données ai-je assez d’expérience pour dire que mon modèle est bon c’est la qualité efficace des données qui pourrait être des erreurs dans les données supposent que j’ai des données médicales et un est enregistré comme 225, alors qu’est-ce que cela signifie pourrait être de 225 jours, auquel cas il s’agit d’un nombre raisonnable, il pourrait être de 22,5 ans à nouveau est un nombre raisonnable ou 22,5 mois est raisonnable.

Mais si cela fait 225 ans, ce n’est pas un nombre raisonnable, donc il y a quelque chose de mal dans les données, alors comment gérer ces choses ou le bruit dans les images ou les valeurs manquantes, donc je parlerai brièvement de la gestion des valeurs manquantes plus tard dans le cours Machine Learning mais c’est comme je l’ai mentionné au début est un cours d’apprentissage machine à droite et ce n’est pas là n’est pas principalement il est principalement préoccupé par les algorithmes d’apprentissage automatique et les mathématiques et l’intuition derrière ceux-ci et pas nécessairement sur les questions de construire une pratique

systèmes basés sur cela. Je vais donc parler de bon nombre de ces questions pendant le cours d’apprentissage automatique, mais je tiens à répéter que ce ne sera pas le point de mire et donc le prochain défi que j’ai énuméré ici est de savoir à quel point je peux être confiant des résultats et je veux que je vais certainement parler un peu parce que toute la prémisse de rapporter les résultats du machine learning dépend de la confiance que vous pouvez avoir des résultats corrects et la dernière question est-ce que je décris les données correctement.

C’est donc un domaine très, très dépendant et la question à laquelle vous ne pouvez répondre qu’avec votre expérience en tant qu’apprentissage automatique ou professionnel des données scientifiques ou avec le temps, mais il y a des questions typiques que vous souhaitez poser qui sont là les diapositives donc à partir du suivant dans le module suivant, nous examinons les différents paradigmes d’apprentissage plus en détail.

Si vous vous souvenez de l’apprentissage supervisé, nous avons parlé de l’expérience là où vous avez une sorte de description des données. Donc, dans ce cas, supposons que j’ai une base de données clients et je le décris par deux attributs ici, l’âge et le revenu.

J’ai donc chaque client qui vient dans ma boutique, je connais bien l’âge du client et le niveau de revenu des clients. (Reportez-vous à l’heure de la diapositive: 00:48) Et mon objectif est de prédire si le client achètera un ordinateur ou non. J’ai donc ce genre de données étiquetées qui me sont données pour construire un bon classificateur, rappelez-vous que nous avons parlé de classification où la sortie est une valeur discrète dans ce cas c’est oui ou non, oui c’est la personne va acheter un ordinateur, non, la personne n’achètera pas d’ordinateur.

Et la façon dont je décris l’entrée est à travers un ensemble d’attributs dans ce cas, nous considérons l’âge et le revenu comme les attributs qui décrivent le droit du client. Et maintenant, le but est de trouver une bonne fonction, de créer une cartographie qui prendra l’âge et le revenu comme entrée et cela vous donnera une sortie qui dit que la personne achètera l’ordinateur ou n’achètera pas l’ordinateur. Il existe donc de nombreuses façons différentes de créer cette fonction et étant donné que nous examinons actuellement une interprétation géométrique des données,

Je regarde les données comme des points dans l’espace. (Reportez-vous à l’heure de la diapositive: 01:57) L’une des façons les plus naturelles de penser à définir cette fonction consiste à tracer des lignes ou des courbes sur la droite de l’espace d’entrée.

Voici donc un exemple possible, alors ici j’ai tracé une ligne et tout à gauche de la ligne à droite. Ce sont donc des points qui sont rouges à droite, donc tout à gauche de la ligne sera classé comme n’achètera pas d’ordinateur, tout à droite de la ligne où la plupart des points de données sont bleus sera classé comme achètera un ordinateur . Alors, à quoi ressemblerait la fonction, elle ressemblerait à quelque chose comme si le revenu d’une personne se souvenait que l’axe des x était le revenu et l’axe des y était l’âge.

Donc, dans ce cas, il dit essentiellement que si le revenu de la personne est inférieur à une certaine valeur, inférieur à certains X, la personne n’achètera pas d’ordinateur. Si le revenu est supérieur à X, la personne achètera votre ordinateur. Voilà donc le genre de fonction simple que nous allons définir. Il remarquera simplement que de cette façon, nous ignorons complètement l’une des variables ici qui est l’âge. Donc, nous allons simplement par revenu, si le revenu est inférieur à certains X, alors la personne n’achètera pas d’ordinateur, si le revenu est supérieur à X, la personne achètera un ordinateur. C’est donc plus ou moins une bonne règle, je veux dire que la plupart des points sont corrects, à l’exception de quelques bons.

Il semble donc que oui, nous pouvons nous pouvons survivre avec cette bonne règle. Ce n’est donc pas trop mal, mais vous pouvez faire un peu mieux. (Reportez-vous à l’heure de la diapositive: 03:29) Très bien, alors maintenant nous avons ces deux points rouges que ceux qui gardent juste que les points sont du mauvais côté de la ligne plus tôt. Semble maintenant être du bon côté à droite, donc

tout à gauche de cette ligne n’achètera pas d’ordinateur, tout à droite achètera un ordinateur à droite, tout le monde à droite achètera un ordinateur. Donc, si vous pensez à ce qui s’est passé ici, nous avons donc bien amélioré notre mesure de performance. Donc, le coût de quelque chose, alors quel est le coût ici. Donc, plus tôt, nous ne prêtons attention qu’au droit au revenu, mais maintenant nous devons aussi prêter attention à l’âge. Donc, plus vous avez raison, plus le seuil de revenu auquel nous allons acheter un ordinateur est plus élevé

droite. Donc, plus vous êtes jeune, plus jeune signifie plus bas sur l’axe y, donc plus vous êtes jeune, le seuil de revenu auquel vous allez acheter un ordinateur est en bas à droite. Donc, c’est clair, donc plus vous avez raison, donc le seuil de revenu est déplacé vers la droite ici, donc plus vous êtes âgé, vous devez donc avoir un revenu plus élevé avant d’acheter un ordinateur et la colère que vous êtes votre seuil de revenu est plus bas, donc cela ne vous dérange pas d’acheter un ordinateur même si votre revenu est légèrement inférieur.

Alors maintenant, nous devons commencer à prêter attention à l’âge, mais l’avantage est que vous obtenez de bien meilleures performances, pouvez-vous faire mieux que cela, oui, d’accord. (Reportez-vous à l’heure de la diapositive: 04:54) Maintenant, presque tout est correct, sauf un point rouge embêtant, mais tout le reste est correct. Et donc ce qui s’est passé ici, nous obtenons de bien meilleures performances, mais au prix d’avoir un bon classificateur plus complexe. Donc, plus tôt, si vous y pensiez en termes géométriques, vous aviez donc d’abord une ligne parallèle à l’axe des y, je devais simplement définir une interception sur l’axe des x à droite. Donc, si X est inférieur à une certaine valeur, alors c’était une classe qui était supérieure à une certaine valeur qui était une autre classe.

Ensuite, la deuxième fonction était en fait une ligne d’affaiblissement comme ça, donc je devais définir à la fois l’ordonnée à l’origine et la pente droite. Et maintenant ici c’est maintenant un quadratique donc je dois bien définir trois paramètres. Je dois donc définir quelque chose comme ax2 + bx + c, j’ai donc défini l’ABC les trois paramètres afin de trouver le quadratique, et j’obtiens de meilleures performances. Pouvez-vous faire mieux que cela? (Reportez-vous à l’heure de la diapositive: 05:57)

D’accord, la somme pour ne semble pas correcte, semble être une fonction trop complexe juste pour obtenir ce bon point. Et je ne suis pas sûr que je ne sois même pas sûr du nombre de paramètres dont vous avez besoin pour dessiner cela parce que Microsoft utilise une sorte de spline PowerPoint utilise une sorte d’interpolation de spline pour dessiner cette courbe, je suis presque sûr que c’est beaucoup, beaucoup plus de paramètres que ça vaut autre chose à noter ici, c’est que ce point rouge particulier que vous voyez est en fait entouré d’une mer de droite bleue. Il est donc très probable qu’il y ait eu un problème là-bas, soit la personne a effectivement acheté un ordinateur et nous n’avons jamais enregistré qu’il a eu quel ordinateur ou il y a une raison extrémiste pour laquelle la personne entre dans la boutique, sûre qu’elle va acheter un ordinateur. ordinateur, mais reçoit ensuite un appel téléphonique disant qu’une urgence doit sortir immédiatement et qu’il est donc parti sans acheter d’ordinateur, il pourrait y avoir diverses raisons pour lesquelles ce bruit s’est produit et ce sera probablement le classificateur le plus approprié. Voilà donc le genre de problèmes auxquels je voudrais penser quelle est la complexité du classificateur que j’aimerais bien et par rapport à la précision du classificateur, alors à quel point

lire plus  Terminal Mac - Cours Udemy gratuits

ses données sont introduites dans une formation ces données sont introduites dans un algorithme de formation à droite et donc les données vont ressembler à ceci dans notre cas à droite. Alors rappelez-vous que nos X sont la variable d’entrée qui réussit toutes les entrées, donc dans ce cas qui devraient avoir le revenu et l’âge, donc x1 est comme 30 000 et 25 et x2 est comme 80 000 et 45 et ainsi de suite et ainsi de suite les Y ou les

les étiquettes correspondent aux couleurs de l’image précédente à droite, donc y1 n’achète pas d’ordinateur Y2 achète un ordinateur et ainsi de suite, donc cela me donne essentiellement le codage des couleurs, donc y1 est essentiellement rouge et y2 est bleu à droite et je vraiment si je Je vais utiliser quelque chose de numérique, c’est ce que nous ferons plus tard. Je ne peux vraiment pas utiliser ces valeurs d’abord ou non numériquement et le X varie trop à droite. Donc, la première coordonnée dans le X est comme 30 000 et 80 000 et ainsi de suite, et la deuxième coordonnée est comme 25 et 45, ce qui est beaucoup plus petit, ce qui entraînera une sorte d’instabilité numérique, alors qu’est-ce qui finissent généralement par faire est de normaliser ceux-ci afin qu’ils se forment de manière appropriée dans la même plage afin que vous puissiez voir que j’ai essayé de normaliser ces valeurs X entre 0 et 1 à droite.

Donc, vous avez choisi un niveau de revenu de disons 2 lakhs, c’est le maximum et l’âge de 100 ans et vous pouvez voir les valeurs normalisées et de même pour les achats et non les achats, je les ai pris non pas comme – 1 et comme l’ordinateur est +1, ce sont des choix arbitraires , maintenant, mais plus tard, vous verrez qu’il y a des raisons spécifiques de vouloir bien choisir cet encodage, puis l’algorithme de formation obstrue correctement ces données et il produira un classificateur alors maintenant ce classificateur, je ne sais pas, je ne sais pas savoir si elle est bonne ou mauvaise à droite, donc nous avions une ligne droite dans le premier cas à droite une ligne parallèle à l’axe si nous ne connaissions pas le bien ou le mal et nous avions besoin d’un mécanisme par lequel nous évaluions ce droit. Alors, comment faisons-nous l’évaluation est généralement que vous avez ce qui est

appelé un ensemble de tests ou un ensemble de validation à droite donc c’est un autre ensemble de chemins x et y comme nous l’avions dans l’ensemble de formation, donc encore une fois dans l’ensemble de tests, nous savons quelles sont les étiquettes, c’est juste que nous ne le montrons pas au algorithme de formation, nous savons ce que sont les étiquettes car nous devons utiliser les étiquettes correctes pour évaluer si votre algorithme de trading fonctionne bien ou non, donc ce processus par lequel cette évaluation se produit est appelé validation plus tard de la validation. Si vous êtes satisfait de la qualité du classificateur, nous pouvons le conserver si vous n’êtes pas satisfait, ils reviennent à l’algorithme de formation et disent que je ne suis pas satisfait de ce que vous avez produit, donnez-moi quelque chose de différent, nous devons donc soit répéter l’algorithme à nouveau, nous allons à nouveau parcourir les données et essayer d’affiner l’estimation des paramètres ou nous pourrions même penser à changer certaines valeurs de paramètres, puis essayer de refaire l’algorithme de formation, mais c’est le processus général et nous verrons que beaucoup des différents algorithmes que nous regardons, regardez dans le cours d’apprentissage automatique pour adapter le cours de ces conférences, suivez ce genre de processus, alors qu’est-ce qui se passe à l’intérieur de cette boîte verte. (Reportez-vous à l’heure de la diapositive: 13:48) Donc, à l’intérieur de l’algorithme de formation, il y aura cet agent d’apprentissage à droite qui prendra une entrée et il p

produit une sortie blanche à laquelle il pense être la bonne sortie, mais il la comparera à la cible réelle pourquoi elle a été donnée pour le droit d’entraînement, donc dans la formation, vous avez réellement une cible pourquoi, donc elle la comparera à une Ciblez pourquoi à droite, puis déterminez quelle est l’erreur et utilisez l’erreur pour changer l’agent correctement afin qu’il puisse produire la bonne sortie la prochaine fois. Ceci est essentiellement un processus itératif de sorte que vous voyez que les entrées produisent correctement une sortie Y ha

t et ensuite vous prenez le Y cible. Vous pouvez le comparer au chapeau en Y pour déterminer quelle est l’erreur et utiliser l’erreur pour changer à nouveau correctement l’agent et c’est en gros la façon dont la plupart de l’apprentissage tous les algorithmes fonctionneront le plus des algorithmes de classification ou même des algorithmes de régression l’ouvriront et nous verrons comment chacun de ceux-ci fonctionne car, nous continuons à droite il y a beaucoup, beaucoup d’applications. (Reportez-vous à l’heure de la diapositive: 14:46) Je veux dire que c’est trop nombreux pour être énumérés ici sont quelques exemples que vous pourriez regarder, par exemple un droit de détection de fraude, nous avons

Et essayez de faire quelque chose de plus sophistiqué, mais vous pouvez voir que même si les températures diurnes sont plus ou moins bien avec les heures nocturnes, nous semblons faire quelque chose de vraiment bien parce que nous allons trop vers vous du côté droit bien comment pouvez-vous faire quelque chose de plus complexe, tout comme dans le cas de la classification où nous voulions obtenir ce bon point afin que nous puissions essayer d’ajuster toutes ces températures qui nous ont été données en regardant une courbe suffisamment complexe. Et encore une fois, comme nous en avons discuté plus tôt, ce n’est probablement pas la bonne réponse et vous êtes probablement dans ce cas étonnamment ou mieux adapté au montage en ligne droite

ht et donc ces types de solutions où nous essayons d’ajuster le bruit dans les données, nous essayons de faire la solution prédire correctement le bruit dans les données de formation sont appelés sur-ajustement sur ajustement

Les ions et l’une des choses que nous cherchons à éviter dans, dans l’apprentissage automatique est de trop s’adapter aux données de formation. (Reportez-vous à l’heure de la diapositive: 19:21) Nous allons donc en parler à nouveau, puis du nouveau cours d’apprentissage automatique, et donc ce que nous faisons est généralement que nous aimerions faire ce que l’on appelle une régression linéaire, certains d’entre vous auraient pu rencontrer cela et différentes circonstances et le but typique de la régression linéaire est de dire de prendre l’erreur que votre ligne commet donc si vous prenez un exemple, disons que j’en prends, disons que je prends un exemple de point quelque part ici à droite

t. Donc, ce sont les données d’entraînement réelles qui vous sont données et c’est la prédiction que votre ligne fait à ce stade, donc cette quantité est essentiellement la, l’erreur de prédiction que cette ligne fait et donc ce que vous faites, c’est que vous essayez de trouver cette ligne qui a le moins d’erreur de prédiction, donc vous prenez le carré des erreurs que votre prédiction fait et ensuite vous essayez de minimiser la, la somme des carrés des erreurs pourquoi prenons-nous les carrés. (Reportez-vous à l’heure de la diapositive: 20:31) Parce que les erreurs peuvent être à la fois positives ou négatives et nous voulons nous assurer que vous minimisez cela, quel que soit le signe de l’erreur, et donc avec suffisamment de données pour qu’une régression linéaire soit assez simple, vous pourrait juste déjà utiliser des inversions matricielles comme nous le verrons plus tard, mais avec de nombreuses dimensions comme le défi est d’éviter

trop ajusté comme nous en avons parlé plus tôt, puis il existe de nombreuses façons d’éviter cela. Et donc je vais à nouveau en parler en détail lorsque nous regardons la régression linéaire

à droite donc un point que je veux faire est que la régression linéaire n’est pas aussi simple qu’il y paraît à droite donc voici un exemple donc j’ai deux variables d’entrée x1 et x2 à droite et si j’essaie d’ajuster une ligne droite avec x1 et x2, je va probablement se retrouver avec quelque chose comme a1 x1 plus a2 x2 à droite et qui ressemble à un avion en deux dimensions à droite. Mais alors, si je prends ces deux dimensions et que je les transforme, transformez l’entrée de sorte qu’au lieu de dire simplement les x1 et x2 si je dis que mon entrée va ressembler à x1 carré x2 au carré x1 x2 puis aux x1 et x2 s c’était au début donc au lieu de regarder une entrée en deux dimensions si je vais regarder une entrée en 5 dimensions à droite. Alors ça

l et maintenant je vais adapter une ligne ou un plan linéaire dans cette entrée à 5 dimensions de sorte que ce sera comme a1 x1 au carré plus a2 x2 carré plus a3 x1 x2 plus a4 x1 plus a5 x2 maintenant qui n’est plus l’équation de une ligne en deux dimensions à droite, ce qui est l’équation d’un polynôme de second ordre en deux dimensions, mais je peux toujours penser que cela fait une régression linéaire parce que je ne fais qu’ajuster une fonction qui va être linéaire dans les variables d’entrée à droite, donc en choisissant une transformation appropriée des entrées. (Reportez-vous à l’heure de la diapositive: 22:38) Je peux adapter n’importe quelle fonction d’ordre supérieur afin de pouvoir résoudre des problèmes très complexes en utilisant la régression linéaire et ce n’est donc pas vraiment une méthode faible comme vous le pensez au premier abord, à première vue, nous le ferons

lire plus  Comment changer l'arrière-plan dans la réunion Zoom

regardez cela un peu plus en détail dans les conférences suivantes à droite et régression notre prédiction peut être appliquée dans une variété d’endroits un endroits populaires dans la prédiction de séries chronologiques, vous pourriez penser à prédire les précipitations dans une certaine région ou combien vous allez dépenser pour vos appels téléphoniques, vous pourriez penser à faire même la classification en utilisant cela.

Si vous pensez à vous, souvenez-vous de notre codage de plus 1 et moins 1 pour les étiquettes de classe afin que vous puissiez penser à plus 1 et moins 1 comme sorties à droite, puis vous pouvez ajuster une courbe de régression de ligne de régression à cela et si la sortie est supérieure de 0, vous diriez que cette classe est plus 1, sa sortie est inférieure à 0, vous voyez que la classe est de moins 1 afin qu’elle puisse utiliser les idées de régression pour adapter la forme résoudra le classificat

problème d’ions et vous pouvez également faire une dépendance aux données. Donc, je ne veux vraiment pas que vous sachiez vous donner tous les millions de points de données que j’ai dans mon ensemble de données, mais ce que je ferais, c’est essentiellement adapter la courbe à cela et ensuite vous donner juste les coefficients de la courbe à droite. Et le plus souvent, cela nous suffit pour avoir une idée des données et cela nous amène à la prochaine application que j’ai répertoriée, qui est l’analyse des tendances, donc je ne suis pas vraiment intéressé par un grand nombre de fois. je

Je ne suis pas intéressé par les valeurs réelles des données mais plus par les tendances, par exemple j’ai une solution que j’essaie de mesurer les temps de fonctionnement et je ne suis pas vraiment intéressé par le temps de fonctionnement réel car avec 37 secondes à 38 les secondes ne me diront pas grand-chose. Mais j’aimerais vraiment savoir si le temps de fonctionnement s’échelonne linéairement ou exponentiellement avec la taille de l’important, afin que ce type d’analyse puisse à nouveau être effectué en utilisant la régression et dans la dernière ici, il s’agit à nouveau d’une analyse des facteurs de risque comme nous l’avons fait dans la classification et vous pouvez voir quels sont les facteurs qui contribuent le plus à la sortie, ce qui nous amène à la fin de ce module sur l’apprentissage supervisé,

Bonjour et bienvenue dans ce module sur l’introduction à l’apprentissage non supervisé, à droite. Donc, dans l’apprentissage supervisé, nous avons examiné comment vous allez gérer les données de formation qui avaient des étiquettes. (Reportez-vous à l’heure de la diapositive: 00:26) .C’est donc cet endroit particulier, c’est un ensemble de données de classification où le rouge désigne une classe et le bleu, l’autre classe. (Reportez-vous à l’heure de la diapositive: 00:35) Et dans un apprentissage non supervisé, vous avez fondamentalement beaucoup de données qui vous sont données, mais elles n’ont pas d’étiquettes attachées à droite, alors nous examinons d’abord le problème du clus

ter où votre objectif est de trouver des groupes de points de données cohérents ou cohésifs dans cet espace d’entrée, voici donc un exemple de clusters possibles. (Reportez-vous à l’heure de la diapositive: 00:57) Donc, cet ensemble de points de données pourrait former un cluster à droite et à nouveau maintenant, cet ensemble de points de données pourrait former un cluster et encore ceux-ci et ceux-là donc il y a comme quatre clusters que nous avons identifiés dans ce cette configuration donc une chose à noter ici est que même dans quelque chose comme le clustering, je dois donc avoir une certaine forme de biais, donc dans ce cas, le biais que j’ai est sous la forme du cluster, donc je suppose que les clusters sont tous des ellipsoïdes à droite et donc vous savez que j’ai dessiné des courbes de forme spécifiques pour représenter les grappes.

Et notez également que tous les points de données n’ont pas besoin de tomber en grappes et qu’il y a quelques points qui ne tombent dans aucun des grappes, c’est principalement un artefact de moi en supposant qu’ils sont ellipsoïdes mais il y a encore d’autres points dans le centre est en fait loin de

tous les autres points de l’ensemble de données doivent être considérés comme des valeurs aberrantes, donc lorsque vous effectuez un clustering, il y a donc deux choses, l’une est que vous êtes intéressé à trouver des groupes cohérents de points et la seconde est que vous êtes également intéressé par trouver des points de données qui ne sont pas conformes aux modèles dans l’entrée et ceux-ci sont connus comme des valeurs aberrantes. (Reportez-vous à Slide Time: 02:23) Et c’est autant de façons différentes et différentes que vous pouvez accomplir en clustering et nous en examinerons quelques-unes dans le cours d’apprentissage automatique et les applications sont nombreuses, alors voici quelques-unes représentatives afin une chose est de bien regarder les données des clients et d’essayer de découvrir les classes de clients que vous connaissez

w il y a tellement plus tôt que nous avons examiné dans le cas d’apprentissage supervisé que nous avons examiné, c’est qu’un client achètera un ordinateur ou n’achètera pas d’ordinateur, par opposition à cela, nous pourrions simplement prendre toutes les données client que vous avez et essayer de simplement regrouper les en différents types

des clients qui viennent dans votre boutique et vous pouvez ensuite faire une sorte de promotions ciblées et différentes catégories de clients. Et cela n’a pas besoin

viennent nécessairement avec des étiquettes que vous savez, je ne vais pas vous dire que ce client est de classe 1, que ce client est de classe 2, vous allez juste savoir quels clients sont les plus similaires les uns avec les autres. Et comme la deuxième application que vous avez illustrée ici, c’est que je pourrais faire un regroupement sur les pixels de l’image afin que vous puissiez découvrir différentes régions dans l’image et ensuite vous pourriez faire une segmentation basée sur cette région différente donc par exemple ici, il a une image de une image d’une scène de plage, puis vous êtes en mesure de comprendre les nuages ​​et le sable et la mer et l’arbre à partir de l’image afin que vous puissiez donner plus de sens à l’image de droite.

Ou vous pouvez faire un clustering sur les usages mondiaux à droite et vous pouvez découvrir des synonymes et vous pouvez également faire un clustering sur les documents à droite et en fonction du type de documents qui sont similaires les uns aux autres et si je vous donne une collection de disons 100 000 documents, je pourrais être en mesure pour comprendre quels sont les différents sujets abordés dans cette collection de documents et les nombreuses façons dont vous pouvez utiliser l’exploration de règles de clustering. (Reportez-vous à l’heure de la diapositive: 04:17)

Et comme je devrais vous donner un site sur l’utilisation du mot exploration ici, beaucoup d’entre vous ont peut-être entendu parler du terme exploration de données et, le plus souvent, les prétendues tâches d’exploration de données sont essentiellement des problèmes d’apprentissage automatique, ce qui pourrait être une régression de la classification et ainsi de suite et ainsi de suite et le premier problème qui a été essentiellement présenté comme un problème minier et non pas comme un problème d’apprentissage était celui des schémas et des associations fréquents d’exploitation minière et c’est l’une des raisons

J’appelle cela l’exploration de règles d’association par opposition à l’apprentissage de règles d’association juste pour garder la connexion historique intacte, donc dans l’exploration de règles d’association, nous sommes intéressés à trouver des modèles fréquents qui se produisent dans les données d’entrée, puis nous examinons les dépendances conditionnelles parmi ces modèles droite.

Et ainsi, par exemple, si A et B se produisent souvent à droite, je pourrais dire quelque chose comme si A se produit, alors B se produira, supposons que vous ayez des clients qui viennent dans votre boutique et chaque fois que le client A visite votre boutique, B personnalisé étiquette également avec lui à droite, donc la prochaine fois que vous trouverez coutumier

alors vous pouvez créer des règles à partir de ceux-ci ou vous pouvez regarder pour trouver des modèles et des graphiques qui sont généralement utilisés dans l’analyse des réseaux sociaux afin que le type d’interactions entre les entités se produise souvent correctement, donc c’est une autre question qui est ce que nous examinons à droite . (Reportez-vous à l’heure de la diapositive: 07:31) Donc, la chose la plus populaire ici est les transactions minières, donc l’application la plus populaire ici est les transactions minières et, comme je l’ai mentionné plus tôt, la transaction est une collection o

f les éléments qui sont achetés ensemble correctement et voici donc un peu de terminologie et c’est un ensemble ou un sous-ensemble d’éléments est souvent appelé un ensemble d’éléments dans la communauté d’exploration de règles d’association et donc la première étape que vous devez faire est de trouver fre

l’article correct est correct. Et vous pouvez conclure que l’ensemble d’éléments A s’il est fréquent implique l’ensemble d’éléments B si A et AUB ou les éléments fréquents sont corrects, de sorte que A et B sont un sous-ensemble, donc AUB est un autre sous-ensemble, donc si A et AUB ou les ensembles d’éléments fréquents, alors vous pouvez disons que l’ensemble d’éléments A implique l’ensemble d’éléments B à droite et comme je l’ai mentionné plus tôt, il existe de nombreuses applications ici, vous pouvez donc penser à prédire la co-occurrence d’événements. (Reportez-vous à l’heure de la diapositive: 08:31) Et l’analyse du panier de marché et l’analyse des séries de types comme je l’ai mentionné plus tôt, vous pourriez penser à des événements déclencheurs ou à de fausses causes de faux et ainsi de suite, ce qui nous amène à la fin de ce module présentant sans surveillance apprentissage.

À qui s’adresse ce cours de Machine Learning:

  • Quiconque souhaite acquérir des connaissances sur la science des données, le python et l’apprentissage automatique

QUE APPRENDREZ-VOUS DANS CE COURS D’APPRENTISSAGE:

  • Espace d’hypothèse et biais inductif
  • Évaluation et validation croisée
  • Régression linéaire
  • Arbre de décision d’apprentissage
  • Exercice Python sur l’arbre de décision et la régression linéaire
  • et bien plus encore!!

100% de réduction sur le coupon Udemy | Apprentissage automatique et Python et science des données Cliquez pour tweeter

[ENROLL THE COURSE]

SI VOUS TROUVEZ CECI COURS UDEMY GRATUIT  » Apprentissage automatique « UTILE ET UTILE, VEUILLEZ ALLER DE L’AVANT PARTAGEZ LES CONNAISSANCES AVEC VOS AMIS PENDANT QUE LE COURS EST TOUJOURS DISPONIBLE





Telecharger ici

Laisser un commentaire

Aller au contenu principal