Távolítsa el az adatok ismétlődő sorát az Excel programban

01/02

Távolítsa el a Duplicate Data Records Excel-t

Duplikátumok eltávolítása - Az azonos rekordok keresése mezőnként. © Ted French

Az Excel-t, például az Excel-t gyakran adatbázisokként használják olyan dolgokra, mint az alkatrész-készletek, az értékesítési rekordok és a levelezőlisták.

Az Excel adatbázisai olyan adatbázist foglalnak magukban, amelyet rendszerint adatrészletekként rendeznek.

A rekordban a sorban lévő cellák vagy mezők adatai kapcsolódnak egymáshoz - például a vállalat neve, címe és telefonszáma.

Az adatbázisban jelentkező gyakori probléma mérete az, hogy duplikált rekordok vagy adatsorok vannak.

Ez a duplikáció akkor fordulhat elő, ha:

Bármelyik módon, az ismétlődő feljegyzések számos problémát okozhatnak - például a dokumentumok több példányának elküldését ugyanazon személynek, amikor az adatbázis-információkat egy levél egyesítés során használják -, ezért jó ötlet a rendszeres alapján.

És bár könnyű kiválaszthatja az ismétlődő feljegyzéseket egy kis mintában, mint például a fenti képen, az adatrekordok könnyen több százat is tartalmazhatnak, ha nem több ezer rekordot, így nagyon nehéz megismételni a dupla rekordot - különösen a részlegesen illeszkedő rekordokat.

A feladat végrehajtásának megkönnyítése érdekében az Excel egy olyan beépített adatkezelő eszközzel rendelkezik, amely nem meglepő módon a Duplikátumok eltávolítása , amellyel azonos és részben egyező rekordokat találhat és távolíthat el.

Azonban, ahogyan az Eltávolítás másolatok eszközt tervezték, azonos és részben egyező rekordokat kell külön kezelni.

Ez azért van, mert a Duplikátumok eltávolítása párbeszédpanelen megjelenik a kiválasztott adattáblázatban szereplő mezők neve, és kiválasztja azokat a mezőket, amelyeket be kell illesztenie a megfelelő rekordok kereséséhez:

Mezőnevek és oszloplevelek

Mint említettük, a Remove Duplicates (Duplikátumok eltávolítása) eszköz egy párbeszédablakból áll, ahol a kívánt mezők vagy oszlopok nevének ellenőrzésével választja ki azokat a megfelelő mezőket, amelyeket keresni szeretne.

A párbeszédpanel - mezõnevek vagy oszlopbetûk - információi attól függnek, hogy az adatok a fenti képen látható adatok tetején tartalmaznak-e fejléc- vagy fejléc- sorokat.

Ha igen - győződjön meg róla, hogy a párbeszédpanel jobb oldalán található - az adataimnak fejlécek - opciója ki van kapcsolva, és az Excel a párbeszédpanelen mezőnevekként jeleníti meg a sor nevét.

Ha az adataid nem tartalmaznak fejlécet, a párbeszédpanelen megjelenik a megfelelő oszlopbetűk a kiválasztott adatkapcsolat párbeszédpanelén.

Szomszédos adatkészlet

Ahhoz, hogy a Duplikátumok eltávolítása eszköz megfelelően működjön, az adattáblának egymástól független adattartománynak kell lennie - azaz nem szabad üres sorokat, oszlopokat és, ha lehetséges, nincsenek üres cellák a táblán belül.

Az adattáblán belül nincsenek üresek az általános adatkezelés terén, és nemcsak az ismétlődő adatok keresésekor. Az Excel egyéb adatkezelői eszközei - például a válogatás és a szűrés - a legjobban működnek, ha az adattáblázat az adatok egy sorozata.

Példány törlése duplikátumadatokkal

A fenti képen az adattáblázat két azonos rekordot tartalmaz az A. Thompson és az R. Holt számára két részlegesen egyező rekordra - ahol az összes mező a diákok számán kívül esik.

Az alábbi lépések részletesen leírják, hogyan kell használni a Remove Duplicates adat eszköz használatát:

  1. Távolítsa el az A. Thompson második azonos rekordjának második részét.
  2. Távolítsa el R. Holt második részlegesen illeszkedő rekordját.

A Duplikák eltávolítása párbeszédpanel megnyitása

  1. Kattints bármelyik csomagra, amely adatokat tartalmaz a mintaadatbázisban.
  2. Kattintson a Data (Adat) fülre a szalagon.
  3. Kattintson az Eltávolítások eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és nyissa meg a Másolat törlése párbeszédpanelt.
  4. A Duplikák eltávolítása párbeszédpanelen megjelenik az adatmintából az összes oszlopcím vagy mezőnév
  5. A mezőnevek melletti jelölőnégyzetek jelzik, hogy az Excel oszlopok hogyan próbálkoznak egymással a kettős rekordok kereséséhez
  6. Alapértelmezés szerint, ha megnyílik a párbeszédpanel, az összes mezőnevet kikapcsolják

Azonos rekordok keresése

  1. Mivel ebben a példában teljesen azonos rekordokat keresünk, az összes ellenőrzött oszlopot el kell hagyni
  2. Kattintson az OK gombra

Ezen a ponton a következő eredményeket kell látni:

02. 02. sz

Keresse meg és távolítsa el a részlegesen összehangolt rekordokat a másolatok eltávolításával

Duplikátumok eltávolítása - Partiálisan illeszkedő rekordok keresése mezőnként. © Ted French

Egy mező egyidejű ellenőrzése

Mivel az Excel csak olyan adatrekordokat távolít el, amelyek pontosan megfelelnek a kiválasztott adatmezőknek, a legmegfelelőbb módja annak, hogy megtalálja az összes részlegesen egyező adatrekordot, eltávolítja a pipa csak egy mezőt egy időben, amint az az alábbi lépésekből következik.

A rekordok későbbi keresése, amelyek minden mezőben megegyeznek a név, az életkor vagy a program kivételével, eltávolít minden lehetséges kombinációt a részlegesen egyező rekordok számára.

Részben megegyező rekordok keresése

  1. Ha szükséges, kattintson az adatlapban lévő adatokat tartalmazó cellákra
  2. Kattintson a Data (Adat) fülre a szalagon .
  3. Kattintson az Eltávolítások eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és nyissa meg a Másolat törlése párbeszédpanelt.
  4. Az adattáblához tartozó összes mezőnév vagy oszlopfejléc van kiválasztva.
  5. Azon rekordok kereséséhez és eltávolításához, amelyek nem egyeznek meg minden mezőben, távolítsa el a jelölőnégyzetet azokon a mezőneveken kívül, amelyeket az Excel figyelmen kívül hagy.
  6. Ehhez a példához kattintson a Jelölő azonosító oszlopának melletti jelölőnégyzetre a pipa jelölésének eltávolításához.
  7. Az Excel csak akkor keresi és távolítja el azokat a rekordokat, amelyek megfelelő adatokkal rendelkeznek a Vezetéknév , Kezdeti és Program mezőkben.
  8. Kattintson az OK gombra
  9. A párbeszédpanelnek zárva kell lennie, és ki kell cserélnie egy üzenetet, melynek jelentése: 1 talált és eltávolított duplikált érték; 6 egyedi érték marad.
  10. Az R. 342-263- as diák azonosítóhoz tartozó R. Holt második rekordját tartalmazó sor törölve lesz az adatbázisból.
  11. Az üzenet mező bezárásához kattintson az OK gombra

Ezen a ponton a példaadat-táblának mentesnek kell lennie minden ismétlődő adatról.