Tregwiki:Jean-Ste

From OpenWetWare
Jump to navigationJump to search

10.6.06

CRs table

les CRs et leur matchs pour xie et al (cutoff?) conserved, (oui, je sais qu'il y a un probleme avec CR20...)

MODULE J$MPITX2 J$MPAX-4 JM$TGATTTRY JM$AAAYWAACM J$MFOXO1 JM$TTANTCA JM$YKACATTT JM$WTGAAAT JM$RAAGNYNNCTTY JM$YATTNATC J$MSRY J$MIRF-1 J$MHNF-3 JM$AAANWWTGC JM$WGTTNNNNNAAA JM$CTAWWWATA
CR2 1 2 0 0 0 1 1 0 0 0 0 0 0 0 0 0
CR3 1 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0
CR1 0 0 0 0 0 0 0 1 2 0 0 0 0 0 0 0
CR6 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
CR7 2 0 0 0 2 0 0 0 0 1 0 0 0 0 0 0
CR4 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0
CR5 2 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
CR21 1 0 0 1 0 0 1 0 0 3 0 0 1 0 0 0
CR8 0 0 1 2 1 0 0 0 0 0 1 1 2 0 0 0
CR9 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0
CR20 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0
CR16 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
CR10 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
CR11 2 4 0 0 1 1 0 0 0 1 0 0 0 0 1 0
CR13 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 2
CR18 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0
CR19 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
CR22 3 0 1 0 0 0 0 0 0 0 0 2 1 1 0 0

28.5.06

locus pitx2 avec words5, words6, gatta, fox et meis [[1]]


19.5.06

Genes with conserved up/downstream sequences in ci/cs: AK7 ALS2CR2 ATP5O C14ORF92 CAPN7 CAPSL DAG1 DUSP8 DYRK1B ENSP00000239392 ENSP00000241001 ENSP00000248545 ENSP00000261522 ENSP00000263263 ENSP00000280051 ENSP00000286492 ENSP00000288710 ENSP00000292314 ENSP00000295469 ENSP00000298565 ENSP00000306148 ENSP00000313157 ENSP00000313933 ENSP00000317360 ENSP00000328163 ENSP00000331791 ENSP00000332257 ENSP00000333335 ENSP00000333552 FOXF1 GPC2 GSPT1 GTL3 HHEX IRX3 JUP KIAA1001 LBX1 MTA2 NINJ2 NKD1 NKX2-3 NUP205 NYD-SP14 PCSK2 POU4F3 Q53EP3_HUMAN Q5TCJ4_HUMAN Q96DN9_HUMAN Q9HBQ9_HUMAN Q9Y5L9_HUMAN ROBO3 RPS19 SALL3 SPRY1 TBX3 TFEC TLE2 USF1 VEZT

Cette liste n'est PAS complete!! Il manque tous les genes qui ne sont pas traduit pas orthologs.txt de ANISEED (--> les numero ENSPxxx surtout). Faut voir les fichiers INTERPRO d'anissed et faut que max bouge un peu le popontin avec GO.


23.1.05

  • Scan D1 module for
    • All matches are conserved in Ci/Cs,
    • high core stringency 0.92
    • overall similarity 0.8
    • remove worst matrices:
    • remove 120 top useless matrices (-> scanning 10 kb random sequences, count matches)
    • remove all matrices vom plants (P$...)
    • remove matrix made from less than 6 binding sites
    • remove matches that do not overlap (with the core!) a mutation made by Lionel (e.g. MEIS was removed here)
    • remove factors that do not exist in C. intestinalis, that are not expressed in anb/nervous system/developmental role
      • Still many matches for FOXes/HNF3 left:
      • HFH3/FOXI: epidermis, (maybe nervous system as well?) ghost
        • HFH3/ciFOXIb: mesenchyme
        • HFH/ciFoxIb: somewhat stronger in the nervous system ghost
      • DRIL1: nervous system,nervecord,epidermis,unidentifiable ghost; articles in pubmed: family with junjomi from the desert
      • Fushi Tarazu: No expression in head -> deleted from matches. ghost
      • BRC Z4: No expression observed -> deleted from matches
      • Hox11/NCX: No data in ghost, one article in pubmed, Gene ontology: "nervous system" but in anus (?) for sea urchin.
      • FALZ: nervous system? ghost
      • chx10=ceh10: expression in Endostyle,Pharyngeal gill,Neural gland,Stomach ghost
      • IPF1: Nerve cord,Brain, also in pharynx, and in the etire trunk ghost
      • PBX1: Notochord,Epidermis,Endoderm,Nerve cord,Brain,Papilla ghost
      • E2F1: Maternal signal was observed throughout embryogenesis, but somewhat stronger in the nervous system and the mesenchyme ghost
      • P300: nervous system,nervecord, weak ghost
      • DFD = HOX4 putative: expression in mesenchyme -> deleted from match-list
      • GR = Glucorticoid receptor: no images in ghost, strange -> deleted from list
      • MEF2: nervous system,endoderm ghost
      • also deleted: V$BARBIE_01 V$TBP_Q6 V$PADS_C V$LDSPOLYA_B V$SPZ1_01 I$DFD_01
  • Result: 48 matches, many foxes: UCSC

Stop reading here. I still have to do the rest this night...


  • Scan otx2, pitx1, pitx2, pitx3, dlx2, dlx4, msx2 for non-conserved matches of:

- all matches of FOX/HNF matrices - all matches for PITX matrix

  • Scan otx2, pitx1, pitx2, pitx3, dlx2, dlx4, msx2 for conserved matches in 4 genomes of

- all matches for conserved FOX/HNF/PITX - using conserved 5: all matches for clusters FOX/PITX2 50/100/150/200 - using conserved 5: all matches for clusters FOX/PITX2 50/100/150/200


  • Scan otx2, pitx1, pitx2, pitx3, dlx2, dlx4, msx2 for conserved matches in 5 genomes of

- all matches for conserved FOX/HNF/PITX - using conserved 5: all matches for clusters FOX/PITX2 50/100/150/200



12.12.05

Module:

  • gatta + Transfac Matrix V$Fox_Q2,
  • Strand has to be identical (both + or both -)
  • Minimum Score for matrix against sequence: Fox_Q2=0.9 matrix info on genomatix server
  • Distance: 12-50 (genomatix-style numbers!)

On UCSC Human Genome

Tu peut cliquer sur les genes, pour etre renvoye sur le browser UCSC avec les annotations de genomatix

  • otx2 trois dont deux match tres bien conserve! (pas conserve dans le zebrafish)
  • pitx2 avec les CRs des Lionel et les resultats du model, un match conserve, un deuxieme match pas conserve
  • dlx2 un match, pas conserve
  • pitx3 un match semi-conserve, le match putatif fox est conserve, pas le gatta
  • dlx4 pas de match, seulement un downstream
  • msx2 un upstream, un downstream, pas de match conserve
  • pitx1 deux matchs, pas conserves
  • dlx2 deux matchs, pas conserves

On UCSC Zebrafish Genome

  • knypek, pas de match conserves, en fait: pourquoi est-ce que c'est important? ce gene semble avoir une conservation beaucoup moins forte que les autres, il n'y a presque rien conserve a partir des exons...

Background matches

  • 100k genome humain choisi au pif et le matches pour le fox tout seul, le gatta tout seul et notre module. il y a 100 matches pour Fox et 12 pour notre module -> Fox: tout le 1000bp, notre module tout le 10kb a peu pres. Mais la, on parle pas de la conservation: seulement 1-2% du genome sont conserve, il trouve beaucoup moins que "tout le 10kb" un match conserve sur le genome humain.

Ciona

  • Pas de match dans pRORa, pRORb (a refaire)
  • DBTGR: Matches conserves dans les promoteurs de Nodal, ACL, MA1, Pitx-Lionel, GI1, peut-etre msxb (pas de C.savigny dans DBTGR). Voir aussi la liste complete des matches DBTGR
  • Pout le Match dans D1, voir le serveur UCSCbeta de Kate avec la conservation Ci,Cs, Oikopleura (sic!) et Bf (sic sic!)

A partir d'ici, je te donne le liens vers le serveur de Kate Rosebloom, c'est ca machine, elle est lente mais jusqu'ici pour moi, ca a bien marche:

  • otx2 pas genial, un match a cote d'une region conserve
  • dll=dlx? pas de match conserve
  • foxe pas de match conserve
  • msxb deux a cote ET conserve!! genial!
  • pitx un match dans D1, un autre CONSERVE dans l'intron 1. Ca doit etre P2, selon page 43-x de la these de Lionel
  • pax6 pax6 and six3 sont lie au developpement de la lentille? deux matchs semi-conserve dans deux introns.
  • pou4: pas de match