Hem Personliga finanser Bedrägeri Detektion med Hadoop - dummies

Bedrägeri Detektion med Hadoop - dummies

Video: TechDays 2018 - Bedrägerier = Cybercrime 2024

Video: TechDays 2018 - Bedrägerier = Cybercrime 2024
Anonim

Den stora volymen av transaktioner gör det svårare att upptäcka bedrägerier på grund av datamängden, ironiskt nog kan samma utmaning bidra till att skapa bättre bedrägeribekämpande modeller - ett område där Hadoop lyser.

I dagens sammanlänkade värld gör den stora volymen och komplexiteten av transaktioner det svårare än någonsin att hitta bedrägeri. Det som brukade kallas "att hitta en nål i en höstack" har blivit uppgiften att "hitta en viss nål i staplar av nålar. ”

Traditionella metoder för att förebygga bedrägerier är inte särskilt effektiva. Till exempel hanteras hanteringen av felaktiga betalningar ofta av analytiker som granskar det som uppgår till ett mycket litet urval av fordringar i kombination med att begära medicinsk dokumentation från riktade sändare. Branschperioden för denna modell är lön och jakt: Fordringar accepteras och betalas ut och processer söker efter avsiktliga eller oavsiktliga överbetalningar genom betalning efter betalning av dessa krav.

Så hur går det att upptäcka bedrägerier nu? På grund av begränsningarna i traditionell teknik byggs bedrägeribekämpning genom att samplera data och använda provet för att bygga en uppsättning modeller för bedrägeribekämpning och -detektering. När du kontrasterar denna modell med en Hadoop-förankrad bedrägeribekämpning som använder hela datamängden - ingen provtagning - för att bygga ut modellerna, kan du se skillnaden.

Det vanligaste återkommande temat du ser på de flesta Hadoop-användarfall är att det hjälper till att bryta igenom glasstaket på volymen och olika data som kan införlivas i beslutsanalys. Ju mer data du har (och ju mer historia du lagrar) desto bättre kan dina modeller vara.

Blanda icke-traditionella dataformer med din uppsättning historiska transaktioner kan göra dina bedrägeribete modeller ännu mer robusta. Om en arbetstagare till exempel gör en arbetstagares ersättningskrav för en dålig rygg från en fall-och-fall-händelse, har en pool av miljontals patientfallssaker som detaljerar behandling och längd av återhämtning hjälper till att skapa ett upptäcktsmönster för bedrägerier.

Som ett exempel på hur denna modell kan fungera kan du föreställa dig att du ska ta reda på om patienter i landsbygdsområden återhämtar sig långsammare än dem i stadsområden. Du kan börja med att undersöka närheten till sjukgymnastik. Finns det ett mönsterförhållande mellan återhämtningstider och geografiskt läge?

Om din bedrägeribekämpning bestämmer att en viss skada tar tre veckors återhämtning men att en jordbrukare med samma diagnos lever en timme från en sjukgymnast och kontorsarbetaren har en utövare på sitt kontor, det är en annan variabel för att lägga till bedrägerierna -detektionsmönster.

När du skördar sociala nätverksdata för sökande och hittar en patient som hävdar att han lider av whiplash pratar om att slutföra den tuffa serien av uthållighetshändelser som kallas Tough Mudder, är det ett exempel på att blanda nya typer av data med traditionella dataskärmar att upptäcka bedrägerier.

Om du vill sparka dina bedrägeribekämpningsinsatser till ett högre växel kan din organisation arbeta för att flytta sig från modellering av marknadssegment och flytta sig mot transaktioner eller på personnivåmodellering.

Det är enkelt att göra en prognos utifrån ett segment, men det är (självklart) bättre att göra ett beslut baserat på viss information om en enskild transaktion. För att göra detta arbetar du upp en större uppsättning data än vad som konventionellt är möjligt i det traditionella tillvägagångssättet. Endast (högst) 30 procent av tillgänglig information som kan vara användbar för bedrägeri modellering används.

För att skapa bedrägeribekämpningsmodeller är Hadoop väl lämpad för

  • Hantera volymen: Det betyder att bearbeta hela datasatsen - ingen datasampling.

  • Hantera nya varianter av data: Exempel är inkludering av närhetstjänster och sociala kretsar för att dekorera bedrägerimodellen.

  • Behåll en smidig miljö: Aktivera olika typer av analyser och ändringar i befintliga modeller.

Bedrägerimodeller kan lägga till och testa nya variabler till modellen utan att behöva göra ett förslag till ditt databasadministratörsteam och vänta sedan några veckor för att godkänna en schemabyte och placera den i sin miljö.

Denna process är kritisk för bedrägeribekämpning eftersom dynamiska miljöer vanligtvis har cykliska bedrägerier som kommer och går i timmar, dagar eller veckor. Om de data som används för att identifiera eller stärka nya bedrägeringsdetekteringsmodeller inte är tillgängliga för tillfället, när du upptäcker dessa nya mönster kan det vara för sent för att förhindra skador.

Utvärdera fördelen för ditt företag att inte bara bygga ut mer omfattande modeller med fler typer av data utan också kunna uppdatera och förbättra dessa modeller snabbare än någonsin. Företaget som kan uppdatera och förbättra modellerna dagligen kommer att gå bättre än de som gör det kvartalsvis.

Du kanske tror att detta problem har ett enkelt svar - fråga din CIO för operativa utgifter (OPEX) och kapitalutgifter (CAPEX) godkännanden för att tillgodose mer data för att skapa bättre modeller och ladda de övriga 70 procenten av data till din beslutsmodeller.

Du kan till och med tro att investeringen kommer att betala sig med bättre bedrägeri upptäckt; Problemet med detta tillvägagångssätt är dock de höga kostnaderna som måste sänkas till okänd data, där du inte vet om den innehåller någon verkligt värdefull insikt.

Visst, tripplar storleken på ditt datalager, till exempel, ger dig mer tillgång till strukturerad historisk data för att finjustera dina modeller, men de kan inte rymma sociala medier. Traditionell teknik är inte lika flexibel. Hadoop gör det enkelt att introducera nya variabler i modellen, och om de visar sig inte ge förbättringar till modellen, kan du helt enkelt kasta bort data och fortsätta.

Bedrägeri Detektion med Hadoop - dummies

Redaktörens val

Byta lager i PowerPoint 2007 Ritningar - dummies

Byta lager i PowerPoint 2007 Ritningar - dummies

När du har flera objekt på en PowerPoint-bild kan de överlappa varandra. PowerPoint hanterar detta problem genom lagringsobjekt. Det första objektet du ritar är längst ner i stapeln; Det andra objektet ligger ovanpå det första; den tredje är ovanpå det andra objektet; och så vidare. Om två objekt överlappar varandra, ...

Grundläggande kommandon i PowerPoint 2007 - dummies

Grundläggande kommandon i PowerPoint 2007 - dummies

Använd tangentbordsgenvägar i PowerPoint 2007 för att spara tid. Oavsett om du formaterar, redigerar eller bara använder vanliga kommandon i PowerPoint 7, visar den här listan kommandot och knapptryckningskombinationen för att få jobbet gjort. Kommandokoder Kommandotyper Ny Ctrl + N Öppna Ctrl + O Spara Ctrl + S Skriv Ctrl + P Hjälp F1 Ny Slide Ctrl + M Redigering ...

ÄNdra layouten av huvudbilder i PowerPoint 2007 - dummies

ÄNdra layouten av huvudbilder i PowerPoint 2007 - dummies

ÄNdra layouten för en PowerPoint-malls bild innebär att du ändrar positionen och storleken på textramar och innehållsramar på dina PowerPoint-bilder samt att ta bort dessa ramar. PowerPoint-innehållsramar håller grafik, clipart-bilder, tabeller och diagram på plats. Textramar rymmer bildtitlar och punktposter eller numrerade listor. För att ändra ...

Redaktörens val

Hur man använder Komodo Redigera funktioner för HTML5 och CSS3 programmering - dummies

Hur man använder Komodo Redigera funktioner för HTML5 och CSS3 programmering - dummies

Komodo Redigera är en bra textredigerare för HTML5 och CSS3 programmering ... Denna redaktör är extremt kraftfull, men är inte så skrämmande som några av de äldre verktygen. Den har ett modernt strömlinjeformat gränssnitt, men mer kraft än du kanske förstår först. Komodo Edit är faktiskt öppen källkus till en kommersiell integrerad ...

Hur man använder nya CSS3 Selectors - dummies

Hur man använder nya CSS3 Selectors - dummies

CSS3 stöder flera nya väljare med intressanta nya funktioner som du bör bli bekant med. Du kan använda dessa nya funktioner för att förbättra sidorna på ännu bättre sätt än tidigare. Attributval Du kan nu tillämpa en stil på något element med ett specifikt attributvärde. Inmatningstaggen tar till exempel olika former, alla ...

Redaktörens val

Använd Google Analytics för att titta på din blogg referraltrafik - dummies

Använd Google Analytics för att titta på din blogg referraltrafik - dummies

Referraltrafik är trafiken du får det som kommer från andra webbplatser än sökmotorer. Du kan få trafik från sociala medier, t.ex. Facebook, Twitter eller StumbleUpon. Eller du kan få trafik från andra bloggar eller webbplatser som länkar till dig. Genom att titta på de platser där din trafik kommer från (och kommer inte ...

Använd OpenX OnRamp-annonsservern för din mammablogga - dummies

Använd OpenX OnRamp-annonsservern för din mammablogga - dummies

En annonsserver är programvara Det gör att du kan hantera alla dina annonser från ett ställe, även om du har mer än en blogg. Den visar annonser, roterar dem, riktar dem och ger resultatrapporter för dina annonseringsklienter också. OpenX har en fri produkt som heter OpenX OnRamp när du kommer till ...

Använd bilder från andra källor i din blogs design - dummies

Använd bilder från andra källor i din blogs design - dummies

För att förbättra din blogg design, dig kan använda egna bilder eller bilder från andra källor, till exempel stockbilder. Att använda bilder på din blogg är enkelt, eftersom Internet är fullt av platser där du kan hitta bilder som du kan använda på din blogg. En stock bild är ett foto licensierat för ...