Hur normaliserar man data i Google Sheets?

Om du arbetar med större datamängder i Google Sheets kan det vara en tråkig process att jämföra variabelvärden. Lyckligtvis är normalisering en statistisk metod som hjälper dig att sortera komplicerade värden i datauppsättningar som är lätta att jämföra.

Den här artikeln kommer att förklara vad normalisering är och hur du kan normalisera data i Google Sheets för statistiska fördelar.

Hur normaliserar man data i Google Sheets?

Anta att vi har några numeriska värden i celler som sträcker sig från A2 till A50. För att normalisera det intervallet till värden mellan X och Y, så här behöver du göra:

  1. Om din första datapunkt är i A2, kan det första normaliserade värdet hittas genom att använda denna formel:

    (YX)*((A2-MIN($A$2:$A$50))/(MAX($A$2:$A$50)-MIN($A$2:$A$50)))+Y

    Använd de numeriska värdena för X och Y direkt.

  2. När du har lagt in formeln för den första siffran flyttar du muspekaren till botten av cellen tills den blir ett kryss. Tryck sedan och dra markören nedåt för att fylla de återstående raderna med formeln. Google Sheets kommer automatiskt att ersätta A2 med motsvarande radnummer för de återstående cellerna, medan allt bakom $-symbolerna inte ändras.
  3. Om du vill hänvisa till värdena för X och Y från andra celler i arken måste du sätta $s före raden och kolumnen i cellerna som värdena finns i (till exempel $D$5), eller kopiera formeln kan ge dig ett analysfel eller felaktiga resultat.
  4. Dina data kommer nu att normaliseras mellan X- och Y-värden.

Att normalisera dina data är ett utmärkt sätt att mäta skillnaderna mellan två datamängder med olika minimi- och maximivärden.

Hur man använder Google Sheets som en databas

Varje databas är i huvudsak en stor tabell (eller många anslutna tabeller), som styrs av ett databashanteringssystem. Om du arbetar med en relativt liten datamängd som inte behöver skalas för mycket kan Google Sheets användas som din databas.

Om du vill börja använda Google Sheets som din databas måste du ha en bakgrund i grundläggande programmering. Du behöver också ett API för att göra arket kompatibelt med SQL och Python. Medan Google erbjuder ett omfattande API för sina tjänster, kan det vara lite för mycket att hantera. Därför rekommenderar vi ark2api eller Autokod för att lösa API-behovet. API-tjänsterna tillhandahåller den anslutning och autentiseringar som krävs för att ansluta dina Google Sheets som din databas och erbjuder tillräckligt med slutpunkter för att möjliggöra ett korrekt databasarbetsflöde.

Den största fördelen med att använda Google Sheets som en databas är att du alltid kan ha en visuell överblick över all data. Eftersom Google Sheets är tillgänglig som en app för mobila enheter och är kompatibel med de flesta webbläsare och operativsystem, kan din databas nås från var som helst i världen. Du kan också direkt överblicka och redigera data i själva arket, istället för att använda kod för att köra en fråga genom databasen för att göra ändringar.

Google Sheets har dock sina begränsningar för databashantering. För det första finns det en tydlig brist på relationella funktioner. Databaser är vanligtvis sammansatta av många tabeller som använder främmande nycklar för att kommunicera med varandra, en process som helt enkelt inte finns i ett enda kalkylblad.

Om du vill ta en titt på ett exempel, överväg avdelningarna i ditt företag. I ett kalkylblad skulle dessa vanligtvis bara vara utskrivna strängar. Det är dock oklokt för en större datamängd. I databaser skulle du ha en separat tabell för företagsavdelningar, med varje avdelning numrerad därefter. Du skulle då referera till avdelningens nummer i uppgifterna om en anställd med hjälp av en främmande nyckel. Genom att ha en separat avdelningstabell kan du göra direkta ändringar i själva avdelningarna utan att köra ändringarna genom hela databasen.

Dessutom kan Google Kalkylark endast lagra fem miljoner celler åt gången. Även om detta kan verka som ett stort antal, kan även medelstora företag ha databaser som går långt över denna gräns. Dessutom kommer du att nå prestandaproblem mycket snabbare innan du når cellgränsen. Med en till synes linjär skalning mellan antalet celler och prestanda kommer du att ha betydande förseningar när du arbetar med en databas som innehåller 100 tusen celler.

Ytterligare FAQ

Kan du infoga data i Google Sheets?

Googles inbyggda API låter dig infoga en tabell direkt från filer. Filimportverktyget stöder följande tillägg:

• .xls

• .xlsx

• .xlsm

• .xlt

• .xltx

• .xltm

• .ods

• .csv

• .Text

• .tsv

• .tab

Dessutom har programvara från tredje part vanligtvis integrationer med Google Sheets. Sheets2api och Autocode, som vi tidigare diskuterat, har båda API-lösningar för att tillhandahålla datainfogning i befintliga tabeller.

Du kan också använda IMPORTRANGE-funktionen för att infoga data från ett Google-ark till ett annat.

Google har också skriptinstruktioner för att skriva innehåll i ett kalkylblad.

Om du lyckas hitta en API-lösning som fungerar för dig kan du enkelt infoga data i Google Sheets när du har kopplat den till din plattform.

Hur rensar jag data i Google Sheets?

Google Sheets erbjuder flera lösningar för att rensa upp och sortera data.

Om du använder Google Formulär för att samla in enkätresultat kan du ställa in Formulär för att automatiskt klistra in svar i ett kalkylark, istället för att klistra in data manuellt.

Google Sheets har också en datavalideringsfunktion. Om du går till Data > Datavalidering kan du ställa in valideringsfunktioner för att förhindra felaktiga värden. Du kan till exempel göra en lista över objekt som kan placeras i en viss kolumn, och att försöka infoga något annat kommer att resultera i ett fel.

Google Kalkylark har också alternativen ”Ta bort dubbletter” och ”Trimma blanksteg”. Detta tar bort eventuella extra värden och blanksteg från dina rader och celler.

Om du vill klistra in mer organiserad data från onlinesidor, använd IMPORTHTML eller IMPORTXML för att få den information du behöver från en webbsida, utan extra röran.

Vad innebär det att normalisera data?

I statistiken kommer normalisering av data att göra det möjligt för dig att göra olika datamängder mer jämförbara.

När du normaliserar data kan du ändra det ursprungliga numeriska värdeintervallet till ett valfritt intervall. Du kan till exempel normalisera olika poängsättningsmetoder till samma värdeintervall för att jämföra dem med varandra.

Normalisering av ett värde x som kommer från ett intervall (y,z) till ett intervall (a,b) görs med följande formel:

X_normaliserad = (b – a) * ((x – y) / (z – y)) + a

Normalisering av data är användbart när dina ursprungliga datauppsättningar inte har rena värden. Till exempel kan standardisering av intervallen till (0 100) hjälpa till att ge en snabb översikt över poängen oberoende av det maximala värdet för själva poängen.

En ytterligare statistisk metod vid datautvärdering är standardisering. Detta gör att de ursprungliga numeriska värdena har ett medelvärde på 0 och en standardavvikelse på 1. De standardiserade värdena kallas ofta z-poäng.

Google Sheets har en funktion som låter dig standardisera en datamängd. Funktionen STANDARDIZE(x, medelvärde, standard_dev) kommer att sätta det numeriska värdet, x, i sin standardiserade form. Du kan använda AVERAGE(range)-funktionen för att få medelvärdet av dina data i tabellen och använda ST_DEV(range)-funktionen för att beräkna datasetets standardavvikelse.

Att tolka standardiserade data är lite annorlunda. Till exempel betyder ett standardiserat tal på -1,5 att det ursprungliga värdet är mindre än genomsnittet med 1,5 gånger standardavvikelsen för uppsättningen.

Standardisering kan vara användbart för att jämföra värden för olika datamängder med olika förväntningar och medel. Eftersom en standardisering alltid sätter medelvärdet till 0 och en avvikelse till 1, kommer de faktiska värdena som presenteras i datasetet inte att störa jämförelsen.

Statistisk analys kan också omvandla en datauppsättning för att passa en viss distribution, men det är en avancerad statistisk funktion som inte kommer att behandlas i den här guiden.

Ny Normal

Normalisering av datamängder är ett otroligt användbart verktyg i dataanalys, och Google Sheets erbjuder en snabb lösning för att normalisera numerisk data. Dessutom kan du använda Google Sheets som en liten databas, om du inte arbetar med extraordinära mängder datauppsättningar för ditt arbete. Integreringarna som Google Sheets har med programvara från tredje part gör den lämplig för en lång rad branscher. Men korrekta databaser kommer att vara mycket mer skalbara.

Vilken typ av information normaliserar du vanligtvis i Google Sheets? Använder du Google Kalkylark för din databas? Låt oss veta i kommentarsfältet nedan.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *