Als u twee gescheiden bestanden (zoals een CSV-bestand) hebt met een gemeenschappelijk veld ertussen, kunt u de bestanden samen voegen om alle relevante gegevens op één regel te krijgen. Beschouw dit proces als de Linux / Unix-opdrachtregelversie van een vlookup in Microsoft Excel.[1] Het heeft het voordeel dat het veel flexibeler is en in staat om veel grotere sets gegevens te verwerken.
Stappen
-
1 Identificeer de twee bestanden die u wilt sorteren voordat u lid wordt. Bijvoorbeeld:
- File One
- Naam: customer_info.csv
- Indeling: CUSTOMER_NUMBER, naam, favorite_store, email_address
- Bestand twee
- Naam: customer_transactions.csv
- Indeling: CUSTOMER_NUMBER, total_purchase_number, total_purchase_amount
- File One
-
2 Sorteer beide bestanden op het veld dat u wilt gebruiken om deel te nemen aan de bestanden. Kies in dit geval het veld dat overeenkomt met "klantnummer" in elk bestand.
- $ sort -t, -k1,1 customer_info.csv> customer_info_sorted.csv
- $ sort -t, -k3,3 customer_transactions.csv> customer_transactions_sorted.csv
-
3 Verbind de twee gesorteerde bestanden samen.
- $ join -t, -1 1 -2 3 customer_info_sorted.csv customer_transactions_sorted.csv> customer_join.csv
Facebook
Twitter
Google+