ఈ వ్యాసం వాస్తవమైన, మాంసం-మరియు-రక్తం మానవుడు-నేను-కానీ ఆన్లైన్లో మీరు చూసే టెక్స్ట్ మరియు వీడియో కంటెంట్ యొక్క పెరుగుతున్న మొత్తం కాదు. ఇది ఉత్పాదక AI సాధనాల నుండి వస్తోంది, ఇవి వాస్తవిక-ధ్వనించే వచనాన్ని మరియు సహజంగా కనిపించే వీడియోను సృష్టించడంలో చాలా మంచివి. కాబట్టి, మీరు రోబోటిక్ నుండి మానవ నిర్మితాన్ని ఎలా క్రమబద్ధీకరిస్తారు?
EM- డాష్ల యొక్క అధిక వినియోగం గురించి పట్టణ పురాణం కంటే సమాధానం చాలా క్లిష్టంగా ఉంటుంది. చాలా మంది ప్రజలు ఆ ప్రత్యేకమైన విరామచిహ్నాల యొక్క సమృద్ధితో వ్రాస్తారు ఏదైనా ఎడిటర్ మీకు చెప్తాడు. ఆధారాలు పదజాలంతో ఎక్కువ సంబంధం కలిగి ఉండవచ్చు మరియు ఏ రచయిత అయినా, పెద్ద భాషా నమూనాలు తమను తాము పునరావృతం చేస్తాయి.
ఇది AI- డిటెక్షన్ ప్రోగ్రామ్ల వెనుక ఉన్న తర్కం. సమస్య ఏమిటంటే, ఆ వ్యవస్థలు తరచూ AI-శక్తితో ఉంటాయి మరియు వారు వారి మదింపులకు ఎలా వచ్చారనే దాని గురించి వారు కొన్ని వివరాలను అందిస్తారు. అది వారిని విశ్వసించడం కష్టతరం చేస్తుంది.
AI- డిటెక్షన్ కంపెనీ నుండి కొత్త లక్షణం కాపీలాక్స్AI లాజిక్ అని పిలువబడే, AI చేత ఏదైనా మరియు ఎంత వ్రాయబడిందో మాత్రమే కాకుండా, ఆ నిర్ణయాన్ని ఏ సాక్ష్యం ఆధారంగా ఉందో మరింత అంతర్దృష్టిని అందిస్తుంది. ఫలితాలు ఏమిటంటే, వ్యక్తిగత గద్యాలై హైలైట్ చేయబడి, దోపిడీ డిటెక్టర్ లాగా కనిపిస్తుంది. కాపీలాక్స్ దీనిని ఫ్లాగ్ చేసిందో లేదో మీరు చూడవచ్చు ఎందుకంటే ఇది AI- ఉత్పత్తి అని తెలిసిన వెబ్సైట్లో వచనాన్ని సరిపోల్చింది, లేదా ఇది సంస్థ యొక్క పరిశోధన నిర్ణయించిన ఒక పదబంధం అయితే మానవ-వ్రాసిన వచనం కంటే AI- ఉత్పత్తి చేసిన AI- ఉత్పత్తిలో కనిపించే అవకాశం ఉంది.
ఈ రోజుల్లో ఒకదానితో వచనాన్ని ఉత్పత్తి చేయడానికి మీరు తప్పనిసరిగా జెన్ ఐ సాధనాన్ని వెతకవలసిన అవసరం లేదు. మైక్రోసాఫ్ట్ మరియు గూగుల్ వంటి టెక్ కంపెనీలు కార్యాలయ అనువర్తనాలకు AI సహాయకులను జోడిస్తున్నాయి, అయితే ఇది డేటింగ్ అనువర్తనాల్లో కూడా కనిపిస్తోంది. టిండర్ మరియు కీలు కలిగి ఉన్న కిన్సే ఇన్స్టిట్యూట్ అండ్ మ్యాచ్ నుండి వచ్చిన ఒక సర్వేలో 26% సింగిల్స్ ఉన్నాయని కనుగొన్నారు డేటింగ్లో AI ని ఉపయోగించడంఇది ప్రొఫైల్లను పంచ్ చేయడం లేదా మంచి పంక్తులతో రావడం. AI రచన తప్పించుకోలేనిది, మరియు మీరు చదువుతున్నదాన్ని ఒక వ్యక్తి వాస్తవానికి వ్రాశారో లేదో తెలుసుకోవాలనుకునే సందర్భాలు ఉన్నాయి.
కాపీలాక్స్-తనిఖీ చేసిన వచనం నుండి వచ్చిన ఈ అదనపు సమాచారం మానవ-వ్రాసిన AI- తయారు చేసిన AI- తయారు చేసినదాన్ని వేరుచేసే మార్గం కోసం అన్వేషణలో ఒక అడుగు ముందుకు ఉంటుంది, కాని ముఖ్యమైన అంశం ఇప్పటికీ సాఫ్ట్వేర్ కాదు. ఈ డేటాను చూడటానికి మరియు యాదృచ్చికం మరియు దాని గురించి ఏమిటో గుర్తించడానికి మానవుడు పడుతుంది.
“ఆలోచన నిజంగా ప్రశ్న మార్క్ లేని స్థితికి చేరుకోవాలనే ఆలోచన ఉంది, మనకు సాధ్యమైనంత ఎక్కువ సాక్ష్యాలను అందించడం” అని కాపిలాక్స్ సిఇఒ అలోన్ యామిన్ నాకు చెప్పారు.
ఒక గొప్ప సెంటిమెంట్, కానీ AI డిటెక్టర్ ఏమి గుర్తించాలో మరియు ఎందుకు అని నేను కూడా చూడాలనుకున్నాను.
AI డిటెక్షన్ ఎలా పనిచేస్తుంది
కాపీరైట్ ఉల్లంఘనను గుర్తించే మార్గంగా నిర్దిష్ట రచనా శైలులను గుర్తించడానికి AI మోడళ్లను ఉపయోగించడం ద్వారా కాపీలాక్స్ ప్రారంభమయ్యాయి. 2022 లో ఓపెనాయ్ యొక్క చాట్గ్ప్ట్ సన్నివేశంలో పేలినప్పుడు, పెద్ద భాషా నమూనాల శైలిని గుర్తించడానికి అదే మోడళ్లను ఉపయోగించవచ్చని కంపెనీ గ్రహించింది. యామిన్ దీనిని “AI వర్సెస్ AI” అని పిలిచాడు, ఆ మోడళ్లలో వాక్యాల పొడవు, విరామచిహ్నాల వినియోగం మరియు నిర్దిష్ట పదబంధాలు వంటి నిర్దిష్ట కారకాలను వెతకడానికి శిక్షణ ఇవ్వబడింది. .
AI ని గుర్తించడానికి AI ని ఉపయోగించడంలో సమస్య ఏమిటంటే, పెద్ద భాషా నమూనాలు తరచుగా “బ్లాక్ బాక్స్” – అవి అర్ధమయ్యే అవుట్పుట్ను ఉత్పత్తి చేస్తాయి మరియు వారికి శిక్షణ ఇవ్వడానికి మీకు తెలుసా, కాని వారు వారి పనిని చూపించరు. కాపిలైక్స్ యొక్క AI లాజిక్ ఫంక్షన్ వీల్ను వెనక్కి తీసుకోవడానికి ప్రయత్నిస్తుంది, అందువల్ల ప్రజలు కాపీలో వారు అంచనా వేస్తున్న దాని గురించి ప్రజలు మంచి అవగాహన కలిగి ఉంటారు.
“నిజంగా ముఖ్యమైనది AI మోడళ్ల చుట్టూ ఎక్కువ పారదర్శకత కలిగి ఉండటం [as possible]అంతర్గతంగా కూడా, “యామిన్ అన్నాడు.
మరింత చదవండి: AI ఎసెన్షియల్స్: మా నిపుణుల అభిప్రాయం ప్రకారం, మీ కోసం Gen ai పని చేయడానికి 29 మార్గాలు
AI లాజిక్ LLM రాసిన వచనాన్ని గుర్తించడానికి రెండు వేర్వేరు విధానాలను ఉపయోగిస్తుంది. ఒకటి, AI సోర్స్ మ్యాచ్ అని పిలుస్తారు, కాపిలైక్స్ ద్వారా లేదా ఆన్లైన్లో AI- ఉత్పత్తి చేసిన సైట్లలో ఇంటిలో సృష్టించబడిన మూలాల నుండి AI- ఉత్పత్తి చేసిన కంటెంట్ యొక్క డేటాబేస్ను ఉపయోగిస్తుంది. ఇది సాంప్రదాయ ప్లాగియారిజం డిటెక్టర్ లాగా పనిచేస్తుంది. “మేము కనుగొన్నది ఏమిటంటే, AI కంటెంట్, చాలా సమయం, మీరు అదే ప్రశ్నను లేదా ఇలాంటి ప్రశ్నను పదే పదే అడిగితే, మీకు ఇలాంటి సమాధానాలు లేదా అదే సమాధానం యొక్క ఇలాంటి సంస్కరణ లభిస్తుంది” అని యామిన్ చెప్పారు.
ఇతర భాగం, AI పదబంధాలు, కాపిలైక్స్ పరిశోధన నిర్ణయించిన పదాల నిబంధనలు మరియు సమూహాలను కనుగొంటుంది, మానవ రచయితల కంటే LLM లు ఉపయోగించుకునే అవకాశం ఉంది. ఒక నమూనా నివేదికలో, కాపిలాక్స్ “టెక్నాలజీలో పురోగతితో” అనే పదబంధాన్ని AI- వ్రాసినదిగా గుర్తించారు. ఉత్పత్తి చేయబడిన కంటెంట్ యొక్క కాపీలాక్స్ యొక్క విశ్లేషణలో ఈ పదం మిలియన్ AI- వ్రాసిన పత్రాలకు 125 సార్లు కనిపించిందని కనుగొన్నారు, ప్రజలు రాసిన మిలియన్ పత్రాలకు కేవలం ఆరు సార్లు పోలిస్తే.
ప్రశ్న, ఇది పని చేస్తుందా?
కాపిలైక్స్ AI కంటెంట్ను గుర్తించి, ఎందుకు వివరించగలదు?
AI లాజిక్ నాకు తెలిసిన వాటిని AI- సృష్టించిన కంటెంట్గా గుర్తించగలదా లేదా మానవ-వ్రాసిన కంటెంట్ను AI- వ్రాసినదిగా ఫ్లాగ్ చేస్తుందో లేదో తెలుసుకోవడానికి నేను కొన్ని పత్రాలను కాపిలాక్స్ ద్వారా అమలు చేసాను.
ఉదాహరణ: మానవ వ్రాసిన క్లాసిక్
కృత్రిమ మేధస్సు గురించి కథ కంటే కృత్రిమ మేధస్సు సాధనాన్ని పరీక్షించడానికి మంచి మార్గం ఏమిటి? ఐజాక్ అసిమోవ్ యొక్క క్లాసిక్ 1956 చిన్న కథ యొక్క ఒక విభాగాన్ని పరీక్షించమని నేను కోపిలాక్స్ అడిగాను చివరి ప్రశ్నకాల్పనిక కృత్రిమ మేధస్సు గురించి కష్టమైన సమస్యను పరిష్కరించడం గురించి. కాపిలైక్స్ దీనిని ఇంటర్నెట్లో 100% సరిపోలిన వచనంగా మరియు 0% AI- వ్రాసినట్లు విజయవంతంగా గుర్తించింది.
ఉదాహరణ: పాక్షికంగా AI-వ్రాసింది
ఈ ఉదాహరణ కోసం, నేను ఈ రోజు వ్రాసిన మరియు ప్రచురించిన కథకు అదనపు కాపీ యొక్క రెండు పేరాగ్రాఫ్లను జోడించమని చాట్గ్ట్ను అడిగాను. నేను ఫలిత వచనాన్ని నడిపాను-నా అసలు కథ రెండు AI- వ్రాసిన పేరాగ్రాఫ్లతో దిగువన జోడించబడింది-కాపిలైక్స్ ద్వారా.
ఈ కాపీలో 65.8% ఇప్పటికే ఉన్న వచనానికి సరిపోసినట్లు కాపిలైక్స్ విజయవంతంగా గుర్తించింది (ఎందుకంటే ఇది అక్షరాలా ఇప్పటికే ఇంటర్నెట్లో ఒక వ్యాసం), కానీ ఇది AI- సృష్టించినట్లుగా ఏమీ తీసుకోలేదు. ఆ రెండు పేరాలు చాట్గ్ప్ట్ ఇప్పుడే రాశారా? రాడార్ కింద పూర్తిగా ఎగిరింది.
చిత్రాన్ని విస్తరించండి
కొన్ని పేరాలు మాత్రమే ఉన్నప్పటికీ, ఈ వ్యాసంలోని ప్రతిదీ AI రాసినది అని కోపీలాక్స్ భావించారు.
నేను మళ్ళీ ప్రయత్నించాను, ఈసారి అడుగుతున్నాను నా ప్రస్తుత కథకు కొంత కాపీని జోడించడానికి గూగుల్ జెమిని. 67.2% వచనంలో 67.2% ఆన్లైన్లో సరిపోలినట్లు కాపైలైక్స్ మళ్లీ గుర్తించింది, అయితే ఇది 100% వచనంలో AI- ఉత్పత్తి చేసి ఉండవచ్చు. నేను రాసిన వచనం కూడా “జనరేటివ్ AI మోడల్” వంటి కొన్ని పదబంధాలతో ఫ్లాగ్ చేయబడింది, AI- వ్రాసిన వచనంలో మరింత తరచుగా సంభవిస్తుందని వర్ణించబడింది.
ఉదాహరణ: పూర్తిగా ఐ-వ్రాసినది
వాస్తవికతతో పూర్తిగా సంబంధం లేని విషయాలను సృష్టించే ఉత్పాదక AI యొక్క సామర్థ్యం యొక్క పరీక్షలో, సిన్సినాటి బెంగాల్స్ సూపర్ బౌల్ గెలిచినట్లుగా ఒక వార్తా కథనాన్ని వ్రాయమని అడిగాను. .
చిత్రాన్ని విస్తరించండి
సూపర్ బౌల్ను గెలుచుకున్న సిన్సినాటి బెంగాల్స్ AI చాట్బాట్ రాసిన సిన్సినాటి బెంగాల్స్ గురించి కాపిలైక్స్ యొక్క AI లాజిక్ ఈ కథను త్వరగా గ్రహించింది.
కాపిలైక్స్ ఏమి చేయలేదు, అయితే, ఎందుకు వివరించబడింది. దాని AI సోర్స్ మ్యాచ్ లేదా దాని AI పదబంధాలలో ఫలితాలు కనుగొనబడలేదని ఇది తెలిపింది, కానీ ఒక గమనికతో: “AI ని సూచించే నిర్దిష్ట పదబంధం లేదు. అయినప్పటికీ, ఇతర ప్రమాణాలు ఈ వచనం AI చేత ఉత్పత్తి చేయబడిందని సూచిస్తున్నాయి.”
నేను మళ్ళీ ప్రయత్నించాను, ఈసారి బెంగాల్స్ 49ers కంటే సూపర్ బౌల్ 27-24తో గెలిచిన వేరే చాట్గ్ట్-సృష్టించిన కథతో, మరియు కాపిలైక్స్ మరింత వివరణాత్మక వివరణను అందించింది. ఇది కంటెంట్ 98.7% AI- సృష్టించినదని లెక్కించింది, కొన్ని పదబంధాలు ఒంటరిగా ఉన్నాయి. వీటిలో “అనేక క్లిష్టమైనవి” మరియు “సంవత్సరాల నుండి నిబంధన” వంటి కొన్ని అమాయక పదాలు ఉన్నాయి. ఇది “అభివృద్ధి చెందుతూనే ఉంది, బెంగాల్స్ భవిష్యత్తు” వంటి బహుళ పదబంధాలు లేదా వాక్యాలలో విస్తరించి ఉన్న కొన్ని పదాల తీగలను కూడా ఇది కలిగి ఉంది, ఇది మానవ టెక్స్ట్ పత్రాల కంటే డేటాబేస్ యొక్క AI- ఉత్పత్తి చేయబడిన కంటెంట్లో 317 రెట్లు ఎక్కువగా సంభవించింది. (కాపిలైక్స్తో మొదటి ప్రయత్నంతో సమస్యను లేవనెత్తిన తరువాత, నేను మళ్ళీ ప్రయత్నించాను మరియు ఈ రెండవ పరీక్షకు ఇలాంటి ఫలితాలను పొందాను.)
బెంగాల్స్ ఎప్పుడూ సూపర్ బౌల్ గెలవలేదనే దానిపై ఇది పూర్తిగా పనిచేయలేదని నిర్ధారించుకోవడానికి, లాస్ ఏంజిల్స్ డాడ్జర్స్ వరల్డ్ సిరీస్ను గెలుచుకున్నట్లు ఒక వ్యాసం రాయమని నేను చాట్గ్ట్ను అడిగాను. 50.5% ఆన్లైన్లో ఇప్పటికే ఉన్న వచనంతో సరిపోలినట్లు కాపీలాక్స్ కనుగొంది, కానీ ఇది 100% AI-వ్రాసినదని కూడా నివేదించింది.
అధిక ప్రొఫైల్ ఉదాహరణ
AI యొక్క వివాదాస్పద ఆరోపించినట్లు ఇటీవలి ఉదాహరణను ఉపయోగించి, కోపిలాక్స్ దాని స్వంత కొన్ని పరీక్షలు చేసింది. మేలో, న్యూస్ అవుట్లెట్ నోటస్ అన్నాడు a నివేదిక ట్రంప్ అడ్మినిస్ట్రేషన్ యొక్క మేక్ అమెరికా హెల్తీ నుండి మళ్ళీ కమిషన్ ఉనికిలో లేని విద్యా అధ్యయనాల గురించి సూచనలు ఉన్నాయి. మహా నివేదికలో ఉదహరించబడిన పరిశోధకులు మీడియా సంస్థలకు వారు ఆ పనిని ఉత్పత్తి చేయలేదని చెప్పారు. ఉనికిలో లేని మూలాలకు అనులేఖనాలు AI భ్రాంతులు యొక్క సాధారణ ఫలితం, అందువల్ల LLM ఉదహరించే ఏదైనా తనిఖీ చేయడం చాలా ముఖ్యం. ట్రంప్ పరిపాలన నివేదికను సమర్థించారుప్రతినిధి “మైనర్ సైటేషన్ మరియు ఫార్మాటింగ్ లోపాలు” ని నిందించడం మరియు నివేదిక యొక్క పదార్ధం మారదని పేర్కొన్నారు.
కాపీలాక్స్ దాని వ్యవస్థ ద్వారా నివేదికను నడిపింది, ఇది 20.8% సంభావ్య AI- వ్రాసిన కంటెంట్ను కనుగొంది. పిల్లల మానసిక ఆరోగ్యం దాని AI పదబంధాల డేటాబేస్లో ఎర్ర జెండాలను పెంచిన కొన్ని విభాగాలను ఇది కనుగొంది. AI- వ్రాసిన వచనంలో చాలా తరచుగా సంభవించిన కొన్ని పదబంధాలలో “వారిపై సోషల్ మీడియా యొక్క ప్రభావాలు” మరియు “వారి మానసిక ఆరోగ్యంపై సోషల్ మీడియా యొక్క ప్రతికూల ప్రభావం” ఉన్నాయి.
AI నిజంగా AI- వ్రాసిన వచనాన్ని గుర్తించగలదా?
నా అనుభవంలో, కాపీలైక్స్ నుండి పెరిగిన పారదర్శకత సాధనం ఎలా పనిచేస్తుందో AI డిటెక్షన్ ప్రపంచానికి ఒక అడుగు ముందుకు ఉంటుంది, అయితే ఇది ఇప్పటికీ ఫూల్ప్రూఫ్కు దూరంగా ఉంది. తప్పుడు పాజిటివ్ల యొక్క ఇబ్బందికరమైన ప్రమాదం ఇంకా ఉంది. నా పరీక్షలో, కొన్నిసార్లు నేను కొన్ని గంటల ముందు వ్రాసిన పదాలు (మరియు AI వాటిలో పాత్ర పోషించలేదని నాకు తెలుసు) కొన్ని పదజాలం కారణంగా ఫ్లాగ్ చేయబడవచ్చు. అయినప్పటికీ, కాపిలాక్స్ ఒక జట్టు గురించి బోగస్ న్యూస్ కథనాన్ని గుర్తించగలిగింది, అది ఎప్పుడూ ఛాంపియన్షిప్ను గెలుచుకోలేదు.
మెరుగైన నిర్ణయాలు తీసుకోవడానికి సాధనాలతో AI మరియు ఎలా ఉపయోగించబడిందో అంచనా వేయవలసిన వ్యక్తులకు లక్ష్యం తప్పనిసరిగా సత్యం యొక్క అంతిమ వనరుగా ఉండవలసిన అవసరం లేదని యామిన్ అన్నారు. మానవుడు లూప్లో ఉండాల్సిన అవసరం ఉంది, కానీ కాపిలైక్స్ వంటి సాధనాలు నమ్మకానికి సహాయపడతాయి.
“చివరికి ఆలోచన కంటెంట్ను అంచనా వేసే ప్రక్రియలో మానవులకు సహాయం చేయడమే” అని ఆయన అన్నారు. “మేము ప్రతిచోటా కంటెంట్ ఉన్న యుగంలో ఉన్నామని నేను భావిస్తున్నాను, మరియు ఇది గతంలో కంటే ఎక్కువ మరియు వేగంగా ఉత్పత్తి అవుతోంది. మీరు విశ్వసించగల కంటెంట్ను గుర్తించడం కష్టమవుతుంది.”
ఇక్కడ నా టేక్ ఉంది: AI డిటెక్టర్ ఉపయోగిస్తున్నప్పుడు, మరింత విశ్వాసం కలిగి ఉండటానికి ఒక మార్గం ఏమిటంటే, AI- వ్రాసినట్లుగా ఫ్లాగ్ చేయబడిన వాటిని ప్రత్యేకంగా చూడటం. అప్పుడప్పుడు అనుమానాస్పద పదబంధం అమాయకంగా ఉండవచ్చు మరియు అవకాశం ఉంది. అన్నింటికంటే, మీరు పదాలను క్రమాన్ని మార్చగల చాలా రకాలు మాత్రమే ఉన్నాయి – “జనరేటివ్ AI మోడల్” వంటి కాంపాక్ట్ పదబంధం మనకు మానవులకు చాలా సులభం, AI మాదిరిగానే. కానీ ఇది చాలా పేరాగ్రాఫ్లు అయితే? అది మరింత ఇబ్బందికరంగా ఉండవచ్చు.
AI డిటెక్టర్లు, EM డాష్ ఒక AI చెప్పే పుకారు వలె, తప్పుడు పాజిటివ్లు ఉండవచ్చు. ఇప్పటికీ ఎక్కువగా నల్ల పెట్టెగా ఉన్న ఒక సాధనం తప్పులు చేస్తుంది, మరియు వారి స్వంత రచన వారి స్వంత తప్పు ద్వారా ఫ్లాగ్ చేయబడినవారికి ఇది వినాశకరమైనది.
మానవ రచయితలు తమ పని ఆ ఉచ్చులో చిక్కుకోకుండా చూసుకోగలరని నేను యామిన్ను అడిగాను. “మీ పని చేయండి” అని అతను చెప్పాడు. “మీ మానవ స్పర్శ మీకు ఉందని నిర్ధారించుకోండి.”