01/02
Távolítsa el a Duplicate Data Records Excel-t
Az Excel-t, például az Excel-t gyakran adatbázisokként használják olyan dolgokra, mint az alkatrész-készletek, az értékesítési rekordok és a levelezőlisták.
Az Excel adatbázisai olyan adatbázist foglalnak magukban, amelyet rendszerint adatrészletekként rendeznek.
A rekordban a sorban lévő cellák vagy mezők adatai kapcsolódnak egymáshoz - például a vállalat neve, címe és telefonszáma.
Az adatbázisban jelentkező gyakori probléma mérete az, hogy duplikált rekordok vagy adatsorok vannak.
Ez a duplikáció akkor fordulhat elő, ha:
- Az egész rekord többször kerül be az adatbázisba, így két vagy több azonos rekordot eredményez
- A több rekordnak egy vagy több mezője van, például egy név és cím, amely ugyanazokat az adatokat tartalmazza.
Bármelyik módon, az ismétlődő feljegyzések számos problémát okozhatnak - például a dokumentumok több példányának elküldését ugyanazon személynek, amikor az adatbázis-információkat egy levél egyesítés során használják -, ezért jó ötlet a rendszeres alapján.
És bár könnyű kiválaszthatja az ismétlődő feljegyzéseket egy kis mintában, mint például a fenti képen, az adatrekordok könnyen több százat is tartalmazhatnak, ha nem több ezer rekordot, így nagyon nehéz megismételni a dupla rekordot - különösen a részlegesen illeszkedő rekordokat.
A feladat végrehajtásának megkönnyítése érdekében az Excel egy olyan beépített adatkezelő eszközzel rendelkezik, amely nem meglepő módon a Duplikátumok eltávolítása , amellyel azonos és részben egyező rekordokat találhat és távolíthat el.
Azonban, ahogyan az Eltávolítás másolatok eszközt tervezték, azonos és részben egyező rekordokat kell külön kezelni.
Ez azért van, mert a Duplikátumok eltávolítása párbeszédpanelen megjelenik a kiválasztott adattáblázatban szereplő mezők neve, és kiválasztja azokat a mezőket, amelyeket be kell illesztenie a megfelelő rekordok kereséséhez:
- Az azonos rekordok esetén keressen az összes mezőt - hagyja el az oszlopok vagy mezőnevek melletti jelölőnégyzeteket;
- Részben összehangolt rekordok esetén - hagyja el a jelölőnégyzeteket csak az illeszkedő mezők mellett.
Mezőnevek és oszloplevelek
Mint említettük, a Remove Duplicates (Duplikátumok eltávolítása) eszköz egy párbeszédablakból áll, ahol a kívánt mezők vagy oszlopok nevének ellenőrzésével választja ki azokat a megfelelő mezőket, amelyeket keresni szeretne.
A párbeszédpanel - mezõnevek vagy oszlopbetûk - információi attól függnek, hogy az adatok a fenti képen látható adatok tetején tartalmaznak-e fejléc- vagy fejléc- sorokat.
Ha igen - győződjön meg róla, hogy a párbeszédpanel jobb oldalán található - az adataimnak fejlécek - opciója ki van kapcsolva, és az Excel a párbeszédpanelen mezőnevekként jeleníti meg a sor nevét.
Ha az adataid nem tartalmaznak fejlécet, a párbeszédpanelen megjelenik a megfelelő oszlopbetűk a kiválasztott adatkapcsolat párbeszédpanelén.
Szomszédos adatkészlet
Ahhoz, hogy a Duplikátumok eltávolítása eszköz megfelelően működjön, az adattáblának egymástól független adattartománynak kell lennie - azaz nem szabad üres sorokat, oszlopokat és, ha lehetséges, nincsenek üres cellák a táblán belül.
Az adattáblán belül nincsenek üresek az általános adatkezelés terén, és nemcsak az ismétlődő adatok keresésekor. Az Excel egyéb adatkezelői eszközei - például a válogatás és a szűrés - a legjobban működnek, ha az adattáblázat az adatok egy sorozata.
Példány törlése duplikátumadatokkal
A fenti képen az adattáblázat két azonos rekordot tartalmaz az A. Thompson és az R. Holt számára két részlegesen egyező rekordra - ahol az összes mező a diákok számán kívül esik.
Az alábbi lépések részletesen leírják, hogyan kell használni a Remove Duplicates adat eszköz használatát:
- Távolítsa el az A. Thompson második azonos rekordjának második részét.
- Távolítsa el R. Holt második részlegesen illeszkedő rekordját.
A Duplikák eltávolítása párbeszédpanel megnyitása
- Kattints bármelyik csomagra, amely adatokat tartalmaz a mintaadatbázisban.
- Kattintson a Data (Adat) fülre a szalagon.
- Kattintson az Eltávolítások eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és nyissa meg a Másolat törlése párbeszédpanelt.
- A Duplikák eltávolítása párbeszédpanelen megjelenik az adatmintából az összes oszlopcím vagy mezőnév
- A mezőnevek melletti jelölőnégyzetek jelzik, hogy az Excel oszlopok hogyan próbálkoznak egymással a kettős rekordok kereséséhez
- Alapértelmezés szerint, ha megnyílik a párbeszédpanel, az összes mezőnevet kikapcsolják
Azonos rekordok keresése
- Mivel ebben a példában teljesen azonos rekordokat keresünk, az összes ellenőrzött oszlopot el kell hagyni
- Kattintson az OK gombra
Ezen a ponton a következő eredményeket kell látni:
- A párbeszédpanelnek zárva kell lennie, és ki kell cserélnie egy üzenetet, melynek jelentése: 1 talált és eltávolított duplikált érték; 7 egyedi érték marad.
- Az A. Thompson ismétlődő rekordot tartalmazó sor törölve lesz az adatbázisból
- Annak ellenére, hogy az R. Holt számára két részlegesen illeszkedő rekord van, mivel nem minden mező illeszkedik - a két rekord diákszáma különbözik - az Excel úgy tekinti, hogy ez egy egyedülálló adatrekord
02. 02. sz
Keresse meg és távolítsa el a részlegesen összehangolt rekordokat a másolatok eltávolításával
Egy mező egyidejű ellenőrzése
Mivel az Excel csak olyan adatrekordokat távolít el, amelyek pontosan megfelelnek a kiválasztott adatmezőknek, a legmegfelelőbb módja annak, hogy megtalálja az összes részlegesen egyező adatrekordot, eltávolítja a pipa csak egy mezőt egy időben, amint az az alábbi lépésekből következik.
A rekordok későbbi keresése, amelyek minden mezőben megegyeznek a név, az életkor vagy a program kivételével, eltávolít minden lehetséges kombinációt a részlegesen egyező rekordok számára.
Részben megegyező rekordok keresése
- Ha szükséges, kattintson az adatlapban lévő adatokat tartalmazó cellákra
- Kattintson a Data (Adat) fülre a szalagon .
- Kattintson az Eltávolítások eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és nyissa meg a Másolat törlése párbeszédpanelt.
- Az adattáblához tartozó összes mezőnév vagy oszlopfejléc van kiválasztva.
- Azon rekordok kereséséhez és eltávolításához, amelyek nem egyeznek meg minden mezőben, távolítsa el a jelölőnégyzetet azokon a mezőneveken kívül, amelyeket az Excel figyelmen kívül hagy.
- Ehhez a példához kattintson a Jelölő azonosító oszlopának melletti jelölőnégyzetre a pipa jelölésének eltávolításához.
- Az Excel csak akkor keresi és távolítja el azokat a rekordokat, amelyek megfelelő adatokkal rendelkeznek a Vezetéknév , Kezdeti és Program mezőkben.
- Kattintson az OK gombra
- A párbeszédpanelnek zárva kell lennie, és ki kell cserélnie egy üzenetet, melynek jelentése: 1 talált és eltávolított duplikált érték; 6 egyedi érték marad.
- Az R. 342-263- as diák azonosítóhoz tartozó R. Holt második rekordját tartalmazó sor törölve lesz az adatbázisból.
- Az üzenet mező bezárásához kattintson az OK gombra
Ezen a ponton a példaadat-táblának mentesnek kell lennie minden ismétlődő adatról.