J'ai un fichier csv comme ceci: column1 column2 john kerry adam stephenson ashley hudson etc.. Je veux supprimer les doublons à partir de ce fichier, pour obtenir que: J'ai écrit ce script qui supprime les doublons en fonction lastnames, mais j'ai besoin de supprimer les doublons en fonction lastnames ET prénom. import csv reader = csv. reader ( open ( '', 'r'), delimiter = ', ') writer = csv. writer ( open ( '', 'w'), delimiter = ', ') lastnames = set () for row in reader: if row [ 1] not in lastnames: writer. Supprimer les doublons python youtube. writerow ( row) lastnames. add ( row [ 1]) "J'ai écrit ce script qui supprime les doublons basés sur des noms, mais j'ai besoin de supprimer les doublons basée sur le nom ET prénom". Je suis un peu perdu ici. Quand vous dites le nom voulez-vous dire un prénom, un nom ou d'un enchaînement? Votre script ne fonctionne que sur les noms de famille. Désolé d'être pas claire, je veux supprimer les doublons en fonction lastnames (colonne2) et firstnames (colonne1) Original L'auteur Reveclair | 2012-10-12
Si True, modifiez l'appelant DataFrame. ignore_index Booléen. Si True, les index de la DataFrame originale sont ignorés. La valeur par défaut est False, ce qui signifie que les index sont utilisés. Renvoie Si inplace est True, un DataFrame supprimant toutes les lignes en double du DataFrame; sinon None. Supprimer les doublons dataframe python. Exemples de codes: Supprimer les lignes en double en utilisant Pandas t_index() Méthode import pandas as pd fruit_list = [ ('Orange', 34, 'Yes', 'ABC'), ('Mango', 24, 'No', 'XYZ'), ('banana', 14, 'No', 'BCD'), ('Orange', 34, 'Yes', 'ABC')] df = Frame(fruit_list, columns = ['Name', 'Price', 'In_Stock', 'Supplier']) print("DataFrame:") print(df) df_unique=df. drop_duplicates() print("DataFrame with Unique Rows:") print(df_unique) Production: DataFrame: Name Price In_Stock Supplier 0 Orange 34 Yes ABC 1 Mango 24 No XYZ 2 banana 14 No BCD 3 Orange 34 Yes ABC DataFrame with Unique Rows: Le DataFrame original a la 1ère et la 4ème ligne identiques. Vous pouvez supprimer toutes les lignes dupliquées du DataFrame en utilisant la méthode drop_duplicates().
Parce que, dans ce cas, elle ne contient qu'un seul caractère, il vous suffit donc de renvoyer le caractère. Maintenant si string[0] == string[1], alors vous voulez ignorer le premier caractère et appliquer la fonction au reste.
Les lignes de code suivantes permettent d'obtenir un tableau. « donnee » est un itérable, c'est-à-dire qu'il s'agit d'un objet dont on peut parcourir les valeurs. Ainsi donnee[i] retourne la i -ème ligne du Pour rechercher des doublons et les supprimer, il va donc falloir parcourir l'ensemble des lignes de ce tableau et les stocker dans une table vide tant qu'elles sont uniques. Supprimer les doublons python download. table[] Création de la variable table for elem in donnee: Parcours des lignes du tableau if elem not in table: (elem) Si la ligne n'est pas déjà présente, on l'ajoute à la table print(table) On affiche la table sans aucun doublon
Comme pour votre souhait, il s'avère que vous pouvez faire exactement. Il suffit d'installer package à partir de PyPI. Cette news n'a pas de surprise me dans le moindre. Je serais étonné si il y a n'est pas un PyPI package pour cela. Ce que je voulais dire, c'est qu'elle devrait faire partie de la piles incluses en python, car ils sont utilisés de manière fréquente. Supprimer des doublons de phrases par debutant_python - OpenClassrooms. Je suis plutôt perplexe quant à pourquoi ils ne sont pas. Original L'auteur Lauritz V. Thaulow