L’utilisation irresponsable des données relatives à la traite: Loi suédoise contre l’achat de sexe

Original: Irresponsible use of trafficking data, or: Garbage in, garbage out, par Laura Agustín, 14 août 2010. Traduction par Thierry Schaffauser.

Il faut de tout dans le filon de la recherche sur la traite, donc je ne serais pas surprise que les nouveaux arrivants sur les questions de la prostitution et de l’industrie du sexe sautent sur un modèle statistique qui tente de prouver que la loi anti-prostitution suédoise fonctionne. Ils ont fait connaitre cette chose après que le gouvernement ait publié son évaluation sans-méthodologie-ni preuve- de la loi criminalisant l’achat de services sexuels.

Niklas Jakobsson et Andreas Kotsadam, de l’Université de Göteborg, l’ont fait sur un blog, avec «Le droit et l’économie de l’esclavage sexuel international», un document de travail – un terme que les universitaires utilisent quand ils n’ont pas encore publié un article dans un journal universitaire. Les journaux envoient les soumissions des contributeurs pour être examinées par des gens dans le même domaine, le processus, appelé examen par les pairs, est généralement à double insu, ce qui signifie que ni l’auteur, ni le critique ne connaisse le nom de l’autre. Ceci n’est pas toujours nécessaire avec une publication universitaire “document de travail” (je ne sais pas si cela a été réalisé avec ce papier ou non).

Les auteurs ont échangé brièvement avec moi, Louise Persson et d’autres sur le blog de Niklas Dougherty, peu de temps après que Louise et moi avons publié un article critiquant l’évaluation du gouvernement sur le Svenska Dagbladet. Niklas a demandé certaines des informations affirmées par les auteurs, soulignant la grande erreur qu’ils ont commise lors de l’acceptation erronée de chiffres danois sur la prostitution de rue – des données qui ont été discréditées au Parlement danois l’an dernier ainsi que dans les médias récemment. Je trouve inconcevablement irresponsable que des chercheurs désireux de se présenter comme «scientifiques» utilisent des données connues comme fausses.

Sur le blog de Niklas (voir les commentaires ), j’ai confronté les auteurs pour échouer de ne pas reconnaître que les «données» qu’ils prétendent utiliser sont intrinsèquement fausses et donc inutilisables. J’ai dit

C’est un fantasme de croire qu’on peut parler de «données» quand il n’y a pas d’accord sur ce qui doit être compté. Certains projets de comptage appellent toutes les femmes migrantes vendant du sexe des victimes de la traite. D’autres appellent tous les sans-papiers des victimes de la traite. D’autres encore appellent toutes les femmes qui vendent du sexe des victimes de la traite. Les chiffres proviennent de petites ONG et des services de police qui utilisent des définitions différentes et souvent admettent être confus.

Je fais aussi exception de ce qu’on me donne de preuves de lieux minuscules, et super-homogènes comme Bergen (Norvège). La recherche nordique est sur des lieux très petits avec des histoires très récentes et courtes d’immigration, la migration clandestine étant encore plus faible. Il est trompeur et ridicule de comparer les «données» de ces sites avec l’ensemble des grands pays ayant des antécédents de migration longs et variés.

La réponse défensive (et inexpérimentée) a été de m’accuser d’être anti-science. Cela n’a aucun sens. Le principe est ici connu partout comme- Entrée de mauvaises données, mauvais résultats (Garbage in, garbage out): peu importe à quel point votre modèle statistique est joli ou quelle machine de luxe vous avez pour croquer les chiffres si les informations d’origine que vous mettez sont de la foutaise, et je suis loin d’être la seule à le penser. La «science» que nous voulons voir est honnête.

Voici l’examen par les pairs, que les auteurs auraient reçu si leur document de travail avait été envoyé à Paula Thomas, une mathématicienne et analyste des statistiques au Royaume-Uni (et si vous êtes intimidés par la langue, regardez le dernier paragraphe).

Commentaires sur le droit et l’économie de l’esclavage sexuel international

1. Le vecteur X_i

Seules les informations à titre indicatif sont données pour ce qu’elles sont. On nous dit (p12) qu’elles comprennent la population, le PIB, la part de la migration (est-ce seulement l’immigration?), Les saisies d’héroïne et une mesure de la primauté du droit. Il semble qu’il y avait d’autres choses dans le vecteur, mais nous ne sommes pas informés de ce qu’elles sont.

Mais ici les principales faiblesses sont de trois ordres: –

(A) L’utilisation de données catégoriques

Les données catégoriques sont, à mon avis, dangereuses, car: –

(I) Elles imposent des jugements de valeur.

(II) Plus sérieusement elles occultent l’ampleur d’un problème tout en apparaissant le clarifier.

(II) sont mieux illustrées à partir des chiffres du crime. Le Service de Police London’s Metropolitan a un système de cartographie du crime excellente. Cependant elle a quelques faiblesses, et celle qui est pertinente ici est l’utilisation de données catégoriques (heureusement cela est atténué par l’utilisation de chiffres réels aussi). Ma propre région est passée d’au dessus de la moyenne pour le cambriolage résidentiel en mai 2010 à faible pour Juin 2010 sur la base qu’il y avait trois crimes de moins! Ai-je besoin d’en dire plus?

(B) L’absence de toute tentative de modéliser (la traite Delta), qui est le changement dans la traite au cours du temps.

(C) L’absence de clarté quant à la façon dont les variables de pondération beta_0 et beta_1 ont été choisies. En particulier le doute doit entourer beta_1 puisque c’est une pondération unique pour un vecteur d’ensemble et que les éléments du vecteur ont des unités différentes, de sorte que certaines analyses dimensionnelles auraient dû être effectuées.

Il serait très utile s’il y avait une section appropriée «méthodologie» pour expliquer les processus utilisé pour obtenir les résultats cités.

2. Le modèle utilisé

Le modèle est un modèle de régression logistique de la formule normale pour ce qui est: –

z = beta_0 + somme (de i = 1 à n) (beta_ {i} x_ {i})

Normalement, ce modèle ne s’applique que lorsque les données sont modélisées par une distribution binomiale.

Une question doit alors être, est ce que les données sont ici une distribution binomiale? Il s’agit pour les auteurs du rapport de le justifier.

Je remarque aussi l’utilisation d’un «terme d’erreur normalement distribuée.” Quelle erreur ce terme exprime t’il? Et comment?

Un autre point est que la variable «z» n’est pas utilisée directement. Le calcul de probabilité est: –

P (event = oui) = 1 / (1-e ^-z)

Ce qui indique comme point qui saute aux yeux que la traite n’est pas un approprié z.

L’événement de la variable z donne la probabilité qu’un événement doit être oui ou non. Puisque la traite est seulement sur une base individuelle oui / non (c.-à-d que le niveau de la traite n’est pas oui ou non), le modèle est suspect.

Les conseils probables aux rédacteurs du journal: l’article n’est pas publiable sans révisions majeures.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.