Als u twee gescheiden bestanden (zoals een CSV-bestand) hebt met een gemeenschappelijk veld ertussen, kunt u de bestanden samen voegen om alle relevante gegevens op één regel te krijgen. Beschouw dit proces als de Linux / Unix-opdrachtregelversie van een vlookup in Microsoft Excel.[1] Het heeft het voordeel dat het veel flexibeler is en in staat om veel grotere sets gegevens te verwerken.

Stappen

  1. 1 Identificeer de twee bestanden die u wilt sorteren voordat u lid wordt. Bijvoorbeeld:
    • File One
      • Naam: customer_info.csv
      • Indeling: CUSTOMER_NUMBER, naam, favorite_store, email_address
    • Bestand twee
      • Naam: customer_transactions.csv
      • Indeling: CUSTOMER_NUMBER, total_purchase_number, total_purchase_amount
  2. 2 Sorteer beide bestanden op het veld dat u wilt gebruiken om deel te nemen aan de bestanden. Kies in dit geval het veld dat overeenkomt met "klantnummer" in elk bestand.
    • $ sort -t, -k1,1 customer_info.csv> customer_info_sorted.csv
    • $ sort -t, -k3,3 customer_transactions.csv> customer_transactions_sorted.csv
  3. 3 Verbind de twee gesorteerde bestanden samen.
    • $ join -t, -1 1 -2 3 customer_info_sorted.csv customer_transactions_sorted.csv> customer_join.csv