eddy 75 Posted March 11, 2011 Report Share Posted March 11, 2011 Dunque, per il superamento del corso di statistica è prevista l'esposizione di un progetto dove in pratica applichiamo ciò che abbiamo imparato durante il corso.. avendo già fatto io il corso so già cosa devo usare: grafici di statistica descrittiva, test statistici e modello lineare con altri grafici. Ora, per il progetto, vengono messi a disposizione dei dati su cui lavorare nei campi più svariati.. una volta presi dei dati ci si inventa il problema e di conseguenza si fanno i test e tutto in base a cosa si vuole concludere. Oppure, ognuno puo' prendersi dei dati da dove vuole (o costruirseli da sè) per poi fare lo stesso lavoro. Ciò che avevo in mente io era un problema di cui qui si è parlato in passato ovvero "la correlazione fra i numeri di tiri di kobe e le vittorie dei lakers". Come fonte ovviamente c'è nba.com che è molto abbondante ma ciò che chiedo a voi è: quali dati prendo? In più credo che un test solo non basti, bisogna farne un po'.. quindi quali altre correlazioni secondo voi sono più evidenti? Se c'è qualcuno "esperto" in campo statistico sarebbe l'ideale ma anche solo capire come arrivare a quella conclusione (ovvero con più di 20 tiri perdiamo ) nel senso quali dati usare sarebbe già un passo in avanti perchè non mi pare che su nba.com esista già una statistica del genere e anche se ci fosse non mi servirebbe perchè ci devo arrivare io :-? Grazie in anticipo a chiunque mi aiuti ^^ Quote Link to post Share on other sites
odino 1,263 Posted March 11, 2011 Report Share Posted March 11, 2011 Ciao Eddy, sono laureato in Statistica. Ma sbaglio, o di base tu vorresti che la tua tesi sia esatta? O vuoi capire se lo è o meno? Quote Link to post Share on other sites
eddy 75 Posted March 11, 2011 Author Report Share Posted March 11, 2011 wow perfetto! per quello che devo fare al dire il vero non c'è molta differenza (se non nelle impostazioni di ipotesi). Secondo me è vera, quindi vorrei arrivare a quella conclusione ma comunque poi calcolerò p-value ecc. per determinare quanto è forte la mia conclusione Quote Link to post Share on other sites
enum 696 Posted March 11, 2011 Report Share Posted March 11, 2011 Odino non sapevo fossi laureato in Statistica! Io ci sto arrivando... Eddy, prima di tutto devi decidere come "barare".... Tieni conto che, in base al risultato che vuoi raggiungere, dovrai (visto che è un "esempio", e non puoi tener conto di TUTTE le variabili che potrebbero far parte del modello che vuoi costruire) capire prima quali variabili sostengono maggiormente la tua tesi (e quali invece ti allontanano da essa), e inserirne/toglierne in base a ciò... Poi ovvio, non sarà un modello realistico al 100% ma credo che per il tuo progetto possa andar bene lo stesso, visto che è un progetto di tipo didattico. (ti dico ciò perchè ho paura che il tuo modello non venga così nettamente a favore della tua ipotesi... ) Quote Link to post Share on other sites
odino 1,263 Posted March 11, 2011 Report Share Posted March 11, 2011 Uah Enum siamo quasi colleghi allora... Aldila' del barare, che dati pensi di usare? Quote Link to post Share on other sites
enum 696 Posted March 11, 2011 Report Share Posted March 11, 2011 Aldila' del barare Credo che tu abbia capito cosa intendo, in questo caso, per "barare" riguardo alle variabili da inserire o da omettere... Certo che poi dipende tutto da quali dati e quali indici utilizzi... :roll: Quote Link to post Share on other sites
Guest Nigma Posted March 11, 2011 Report Share Posted March 11, 2011 Prima di tutto dovrebbe valutare quali dati inferiscono nell'evento e quali no, e già non è semplice. La selezione dei dati a favore e contrari, e quindi il successivo "barare" (cosa che uno statistico non dovrebbe mai fare) è una delle ultime fasi, stando alle basi di statistica che possiedo. Quanti statistici. Quote Link to post Share on other sites
enum 696 Posted March 11, 2011 Report Share Posted March 11, 2011 il successivo "barare" (cosa che uno statistico non dovrebbe mai fare) Ma certo che non va' fatto, non dico che bisogna taroccare le informazioni, figurati! Intendevo il fatto (quel che dicevo anche ad Odino) che qui si sta parlando di un lavoro DIDATTICO, non di una ricerca "reale" e destinata ad essere utilizzata per discernerne politiche (a qualsiasi livello) sociali, economiche o di qualsivoglia tipo... ed essendo un lavoro didattico, non importa che sia "realistica" la conclusione (anche perchè trovarla sarebbe un lavoro gigantesco e in ogni caso sempre interpretabile), quanto piuttosto è importante che il lavoro sia svolto nei modi giusti, utilizzando gli indici opportuni e facendo le opportune analisi sui dati a disposizione. Quote Link to post Share on other sites
Guest Nigma Posted March 11, 2011 Report Share Posted March 11, 2011 Ma certo che non va' fatto, non dico che bisogna taroccare le informazioni, figurati! Intendevo il fatto (quel che dicevo anche ad Odino) che qui si sta parlando di un lavoro DIDATTICO, non di una ricerca "reale" e destinata ad essere utilizzata per discernerne politiche (a qualsiasi livello) sociali, economiche o di qualsivoglia tipo... ed essendo un lavoro didattico, non importa che sia "realistica" la conclusione (anche perchè trovarla sarebbe un lavoro gigantesco e in ogni caso sempre interpretabile), quanto piuttosto è importante che il lavoro sia svolto nei modi giusti, utilizzando gli indici opportuni e facendo le opportune analisi sui dati a disposizione. Su questo sono d'accordo, ma eddy non ha detto (o forse ho letto male io) che deve dimostrare la propria tesi, semmai deve provare a verificare se sia fondata o no, il ché è molto diverso. Il mio professore di statistica diceva: "Di uno statistico che ammetta anche di avere torto fidati sempre, di uno statistico che ti dimostri soltanto che aveva ragione non fidarti mai". Il mio professore era, ovviamente, uno statistico pure lui. Quote Link to post Share on other sites
Heze 1,594 Posted March 11, 2011 Report Share Posted March 11, 2011 La chiave di tutto è fare i calcoli in base 30 Quote Link to post Share on other sites
odino 1,263 Posted March 11, 2011 Report Share Posted March 11, 2011 Beh è ovvio che il "barare" è nel senso molto lato e credo che tutti siamo d'accordo di cosa stiamo parlando. :icon_bananaride: Io agirei così: - identificazione delle variabili correlate all'ipotesi da verificare (W/L, tiri presi, poi magari Assist?); - elaborazione; Confutazione o meno dell'ipotesi "I Lakers vincono quando Kobe prende meno di 20 tiri". Quote Link to post Share on other sites
enum 696 Posted March 11, 2011 Report Share Posted March 11, 2011 eddy non ha detto (o forse ho letto male io) che deve dimostrare la propria tesi, semmai deve provare a verificare se sia fondata o no, il ché è molto diverso. In realtà, Eddy ha scritto: Secondo me è vera, quindi vorrei arrivare a quella conclusione ma comunque poi calcolerò p-value ecc. per determinare quanto è forte la mia conclusione Io mi sono basato su questa frase appena citata. Lui dice che vorrebbe arrivare a una certa conclusione (E per me lo può fare, essendo questo solo un progetto di tipo didattico). Non ha detto che vuole studiare la relazione e verificarne intensità e fondatezza in senso assoluto. Se tu vuoi arrivare a una certa conclusione, è possibile che tu debba "distorcere" la situazione (utilizzando o meno certe variabili che danno indicazioni a te favorevoli oppure no), tutto qui. Quote Link to post Share on other sites
COOPapERino21 1,595 Posted March 11, 2011 Report Share Posted March 11, 2011 Dunque, per il superamento del corso di statistica è prevista l'esposizione di un progetto dove in pratica applichiamo ciò che abbiamo imparato durante il corso.. avendo già fatto io il corso so già cosa devo usare: grafici di statistica descrittiva, test statistici e modello lineare con altri grafici. Ora, per il progetto, vengono messi a disposizione dei dati su cui lavorare nei campi più svariati.. una volta presi dei dati ci si inventa il problema e di conseguenza si fanno i test e tutto in base a cosa si vuole concludere. Oppure, ognuno puo' prendersi dei dati da dove vuole (o costruirseli da sè) per poi fare lo stesso lavoro. Ciò che avevo in mente io era un problema di cui qui si è parlato in passato ovvero "la correlazione fra i numeri di tiri di kobe e le vittorie dei lakers". Come fonte ovviamente c'è nba.com che è molto abbondante ma ciò che chiedo a voi è: quali dati prendo? In più credo che un test solo non basti, bisogna farne un po'.. quindi quali altre correlazioni secondo voi sono più evidenti? Se c'è qualcuno "esperto" in campo statistico sarebbe l'ideale ma anche solo capire come arrivare a quella conclusione (ovvero con più di 20 tiri perdiamo ) nel senso quali dati usare sarebbe già un passo in avanti perchè non mi pare che su nba.com esista già una statistica del genere e anche se ci fosse non mi servirebbe perchè ci devo arrivare io :-? Grazie in anticipo a chiunque mi aiuti ^^ Beh stanotte... è partito 4-4... e lì ho pensato avremmo perso. infatti è seguito un 4-17... >20 tiri e sconfitta... La tua tesi è pronta... :ahah Quote Link to post Share on other sites
enum 696 Posted March 11, 2011 Report Share Posted March 11, 2011 Io agirei così:- identificazione delle variabili correlate all'ipotesi da verificare (W/L, tiri presi, poi magari Assist?); - elaborazione; Confutazione o meno dell'ipotesi "I Lakers vincono quando Kobe prende meno di 20 tiri". Esattamente... :ilsaggio Il punto 1 è sicuramente il più interessante e divertente... Quote Link to post Share on other sites
Guest Jordan Posted March 11, 2011 Report Share Posted March 11, 2011 L'importante è che non usi le statistiche come Hollinger. Quote Link to post Share on other sites
eddy 75 Posted March 11, 2011 Author Report Share Posted March 11, 2011 Io agirei così: - identificazione delle variabili correlate all'ipotesi da verificare (W/L, tiri presi, poi magari Assist?); - elaborazione; Confutazione o meno dell'ipotesi "I Lakers vincono quando Kobe prende meno di 20 tiri". Esatto. L'aiuto che vi ho chiesto è sul primo punto, sul secondo posso fare anche da solo. Nigma comunque ha ragione.. allora forse è meglio se pongo il problema più generale "quali fattori influenzano maggiormente le W dei lakers" senza ovviamente stare a farli tutti, da qui poi faccio qualche test e tiro le mie conclusioni. Il problema è davvero il primo punto anche perchè, ora che ci penso, se dovessi mostrare una correlazione fra tiri di bryant e sconfitte avrei una variabile quantitativa in ascisse e una qualitativa in ordinate? O.o non ricordo di aver mai visto nulla di simile :sei pazzo Sicuramente un diagramma a barre si puo' fare, come quando si distinguono i maschi dalle femmine in una classe, con più di 20 tiri e meno di 20 tiri.. valutare il numero di sconfitte in una stagione. Per la regressione invece? penso si dovrebbero calcolare una manciata d'anni.. certo le cose sono un po' cambiate da quando è arrivato pau ma vabè.. è che 3 anni mi sembra un po' poco.. ma arriviamo al punto: quali dati prendo??? ci sono tutti i numeri di tiri di kobe per ogni partita? Quote Link to post Share on other sites
odino 1,263 Posted March 11, 2011 Report Share Posted March 11, 2011 Dopo un attenta riunione... :grouphug: Possiamo dire che: i dati dall'arrivo di Pau non sono mica pochi, conta 27 RS + 21 PO, 82 + 23, 82 + 23 sono 191 + 67 senza contare quelle di quest'anno. Non so se devi consegnare oltre la fine della RS... Il metodo adesso: quale devi utilizzare? Perché questa sarebbe più un'analisi delle componenti principali... Quote Link to post Share on other sites
Guest Nigma Posted March 11, 2011 Report Share Posted March 11, 2011 Dopo un attenta riunione... :grouphug: Possiamo dire che: i dati dall'arrivo di Pau non sono mica pochi, conta 27 RS + 21 PO, 82 + 23, 82 + 23 sono 191 + 67 senza contare quelle di quest'anno. Non so se devi consegnare oltre la fine della RS... Il metodo adesso: quale devi utilizzare? Perché questa sarebbe più un'analisi delle componenti principali... Che belle le PCA. :suicide2: Quote Link to post Share on other sites
eddy 75 Posted March 12, 2011 Author Report Share Posted March 12, 2011 Dopo un attenta riunione... :grouphug: Possiamo dire che: i dati dall'arrivo di Pau non sono mica pochi, conta 27 RS + 21 PO, 82 + 23, 82 + 23 sono 191 + 67 senza contare quelle di quest'anno. Non so se devi consegnare oltre la fine della RS... Il metodo adesso: quale devi utilizzare? Perché questa sarebbe più un'analisi delle componenti principali... devo spaziare un po' sul programma.. quindi come dicevo: Statistica descrittiva (grafici vari.. a torta,istogramma,boxplot ecc),Test d'ipotesi e Regressione con un modello adatto per dimostrare una dipendenza lineare fra le variabili Quote Link to post Share on other sites
odino 1,263 Posted March 12, 2011 Report Share Posted March 12, 2011 Eddy credo che il punto importante sia la definizione della Y, perché nel tuo caso dato per Y = (0, W; 1, L) dovresti utilizzare una Regressione Logistica (i Logit), altrimenti dovresti definire la Y in maniera diversa. Quote Link to post Share on other sites
eddy 75 Posted March 13, 2011 Author Report Share Posted March 13, 2011 Esatto (anche perchè i Logit non li abbiamo fatti). per questo dicevo che i dati dall'arrivo di pau sono pochi, pensavo di definire la Y come numero di vittorie stagionali e come X la media dei tiri presi da bryant.. però potrebbe essere troppo generale come X Tanto, voglio dire, i dati sulle singole partite posso comunque usarli per i test e i grafici.. nella regressione l'unica soluzione che mi era venuta in mente è questa che ho detto ora Quote Link to post Share on other sites
Guest Nigma Posted March 13, 2011 Report Share Posted March 13, 2011 Eddy credo che il punto importante sia la definizione della Y, perché nel tuo caso dato per Y = (0, W; 1, L) dovresti utilizzare una Regressione Logistica (i Logit), altrimenti dovresti definire la Y in maniera diversa. Se provassi a correlare i tiri di Bryant con i punteggi totali della squadra e, successivamente, a confrontare i punteggi della squadra con vittorie e sconfitte? Avresi una Y non più logica ma numerica, anche se secondo me potrebbe essere inficiata da un presupposto che si chiama avversario: nei Big Match è probabile che Kobe si prenda più tiri ma i Lakers abbiano punteggi più bassi, e viceversa, per cui sarebbe da valutare anche una correlazione fra i tiri di Bryant e la "forza" dell'avversario, ovvero la sua % di vittoria al momento della partita (unico fattore oggettivo per discriminare fra una squadra forte ed una debole al momento della partita, non potendo disporne a fine stagione). Se ti sto complicando la vita ti chiedo scusa in anticipo. Quote Link to post Share on other sites
eddy 75 Posted March 13, 2011 Author Report Share Posted March 13, 2011 ehm.. non credo sia una buona idea perchè incasina di più le cose ma grazie lo stesso Quote Link to post Share on other sites
odino 1,263 Posted March 13, 2011 Report Share Posted March 13, 2011 Così a naso: - Y = punteggio dei Lakers; - X1 = W or L - X2 = rimbalzi (o differenza con l'avversario) - X2 = assist (o differenza) - X3 = tiri di Kobe (o percentuale dal campo) Che ne dici? Quote Link to post Share on other sites
eddy 75 Posted March 13, 2011 Author Report Share Posted March 13, 2011 ora non ho freschissima la teoria però (a naso anchio) direi: X1 no nella regressione, sì nei test e grafici X2 è ottima! anzi, secondo me i lakers hanno una percentuale altissima di vittoria quando dominano sotto i tabelloni.. quindi si potrebbe vedere una bella dipendenza lineare anche se non ho capito bene cosa intendi con "punteggio dei Lakers" .. i punti finali? perchè in tal caso come diceva nigma dipende anche un po' dall'avversario. X3 (ed eventualmente anche X4=% dal campo) le tratterei come X1 ma potrebbero anche andare per la regressione.. ora non so quante regressioni devo fare (credo bastasse una) ma andrò a controllare ma tutti sti dati si trovano su nba.com? Quote Link to post Share on other sites
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.