Separa¸c˜ ao de tomadas: o limiar k ψ corte

4.3 Transi¸c˜ oes graduais

5.1.3 Separa¸c˜ ao de tomadas: o limiar k ψ corte

O parâmetro k_corte^ψ , como visto anteriormente no Cap´ıtulo 4, estabelece um limiar para a distância relativa entre o máximo local e os demais valores na janela. Quanto maior o valor dek^ψ_corte, mais destacado deve ser z¹(i) para que q_i delimite uma tomada.

As Tabelas 5.6 e5.7 mostram como o valor de k^ψ_corte afeta os resultados obtidos pelo

Algo-5.1. AN ´ALISE DE PAR ˆAMETROS 67 V´ıdeo k_corte^ψ Rcorte Pcorte Rgrad Pgrad

CNN 03/02 1998 30 0.7893 0.6190 0.8304 0.6228 40 0.7678 0.7544 0.8304 0.6604 50 0.7357 0.8803 0.8070 0.6667 60 0.6821 0.9409 0.8011 0.7061 70 0.5750 0.9415 0.7602 0.7143 80 0.4321 0.9453 0.6608 0.7290 CNN 22/02/1998 30 0.8867 0.5362 0.6337 0.3636 40 0.8770 0.7324 0.6535 0.4049 50 0.8511 0.9100 0.6436 0.4710 60 0.8285 0.9624 0.6238 0.5122 70 0.7508 0.9667 0.5742 0.5631 80 0.5534 0.9827 0.4950 0.6493 CNN 15/05/1998 30 0.8869 0.6354 0.7328 0.5189 40 0.8728 0.7553 0.7328 0.5454 50 0.8516 0.8486 0.7099 0.5886 60 0.7880 0.9330 0.6870 0.6475 70 0.6714 0.9743 0.6107 0.6452 80 0.4700 0.9708 0.4656 0.6630

Tabela 5.6: Resultados obtidos pelo Algoritmo 4 sobre z_∩¹(i) com kgrad = 0.04, m = 11 e 64 bins para v´arios valores de k^ψ_corte.

ritmo 4 sobre z_∩¹(i) e z¹_◦(i) respectivamente. Estes resultados mostram que valores acima de 50% degeneram o reconhecimento, sobretudo o de cortes.

5.1.4 Transi¸ c˜ oes graduais e o limiar k

grad

O Algoritmo 2 difere pouco do twin-comparison original na deteçcão de transi¸cões graduais.

Um limiar kgrad busca identificar poss´ıveis seqüências de quadros candidatos e, por fim, a diferen¸ca acumulada entre os quadros inicial e final de cada seqüência é analisada de forma similar à deteçcão de cortes.

Valores baixos de kgrad, al´em de gerarem falsos positivos, aumentam o tempo total de

68 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS

V´ıdeo k_corte^ψ Rcorte Pcorte Rgrad Pgrad

CNN 03/02 1998 30 0.7786 0.2781 0.4795 0.7130 40 0.7643 0.3919 0.4971 0.7203 50 0.7571 0.4988 0.5146 0.7586 60 0.7321 0.6137 0.5205 0.7672 70 0.7000 0.7567 0.5029 0.7478 80 0.6536 0.8512 0.4737 0.8020 CNN 22/02/1998 30 0.8835 0.2103 0.3861 0.5821 40 0.8641 0.3034 0.3960 0.5714 50 0.8511 0.4361 0.3861 0.5735 60 0.8284 0.5447 0.3762 0.5672 70 0.8123 0.6711 0.3762 0.5846 80 0.7767 0.8191 0.3564 0.6207 CNN 15/05/1998 30 0.8939 0.2694 0.4580 0.8108 40 0.8728 0.3847 0.4809 0.7590 50 0.8551 0.5020 0.4733 0.7294 60 0.8162 0.6193 0.4962 0.7222 70 0.7668 0.7457 0.4809 0.7159 80 0.6996 0.8684 0.4504 0.7284

Tabela 5.7: Resultados obtidos pelo Algoritmo 4 sobre z_◦¹(i) com kgrad = 0.04, m = 11 e 64 bins para v´arios valores de k^ψ_corte.

5.2. TESTES 69 V´ıdeo k_corte^ψ Rgrad Pgrad

CNN 03/02 1998 0.04 0.8070 0.6667 0.05 0.7544 0.6898 0.06 0.6959 0.7484 0.07 0.6257 0.7589 CNN 22/02/1998 0.04 0.6435 0.4710 0.05 0.5742 0.5088 0.06 0.5148 0.5252 0.07 0.4851 0.5764 CNN 15/05/1998 0.04 0.7099 0.5886 0.05 0.6564 0.6056 0.06 0.6183 0.6807 0.07 0.5725 0.7211

Tabela 5.8: Resultados obtidos pelo Algoritmo 4 sobre z_∩¹(i) com k_corte^ψ = 50%, m = 11 e 64 bins para v´arios valores de kgrad.

processamento devido a maior ocorrência de candidatos. Inversamente, valores altos podem perder transi¸cões, mas reduzem o tempo de execu¸cão do algoritmo.

As Tabelas5.8 e5.9apresentam os resultados obtidos por vários valores dekgrad (com k^ψ_corte fixo em 50%). Movimenta¸cão de câmeras e objetos,zooms e transi¸cões graduais entre tomadas com distribui¸cão similar de luminosidade são as principais causas do baixo desempenho apre-sentado.

5.2 Testes

Os oito v´ıdeos foram processados pelo Algoritmo 4 sobre z_∩¹(i), calculado em histogramas de 64bins, utilizando-se os trˆes melhores valores dek_corte^ψ ekgrad. O suporte temporal foi dado por m= 11.

Os resultados são exibidos nas Tabelas 5.10 e 5.11. O desempenho alcan¸cado na deteçcão

70 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS

V´ıdeo k_corte^ψ Rgrad Pgrad

CNN 03/02 1998 0.02 0.6667 0.6909 0.03 0.5672 0.7239 0.04 0.5146 0.7586 0.05 0.4561 0.7573 0.06 0.4152 0.7717 0.07 0.3567 0.7721 CNN 22/02/1998 0.02 0.5544 0.4786 0.03 0.4257 0.5308 0.04 0.3861 0.5735 0.05 0.3960 0.625 0.06 0.3861 0.7091 0.07 0.3564 0.6923 CNN 15/05/1998 0.02 0.6183 0.6000 0.03 0.5420 0.6961 0.04 0.4733 0.7294 0.05 0.4275 0.7778 0.06 0.3893 0.7612 0.07 0.3511 0.7419

Tabela 5.9: Resultados obtidos pelo Algoritmo 4 sobre z_◦¹(i) com k^ψ_corte = 50%, m = 11 e 64 bins para v´arios valores de kgrad.

5.3. APLICAÇ ÃO: SUMARIZAÇ ÃO DE VÍDEO DIGITAL 71 de cortes é próximo de 90% tanto em reconhecimento quanto em precisão. Já o desempenho obtido na deteçcão de transi¸cões graduais é inferior, girando em torno de 70% para Rgrad e Pgrad. Contudo, este resultado é comumente aceitável em aplica¸cões de sumariza¸cão de v´ıdeo, como a que veremos a seguir.

5.3 Aplica¸ c˜ ao: sumariza¸ c˜ ao de v´ıdeo digital

A Figura 5.1 mostra uma aplica¸cão simples para a delimita¸cão de tomadas: sumariza¸cão de v´ıdeo para a explora¸cão rápida de seu conteúdo por parte do usuário. O sumário, constru´ıdo automaticamente com base nos resultados obtidos pelo Algoritmo 4, pode ser visto em um navegadorWeb comum.

Um quadro-chave ´e apresentado por tomada. A legenda abaixo do quadro informa o n´umero da tomada e seu instante de in´ıcio (minutos e segundos) no v´ıdeo. A medidaz∩(qi, qj)

e aplicada entre os quadros-chaves e comparada a um limiar, criando-se assim referências entre tomadas similares. A Figura 5.1 ilustra uma dessas liga¸cões: a tomada 4 referencia a tomada 44 (as duas exibem o âncora do ABC World News Tonight).

72 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS V´ıdeo k_corte^ψ Rcorte Pcorte kgrad Rgrad Pgrad Rcov Pcov

0.04 0.8304 0.6605 0.7052 0.8446 40% 0.7678 0.7544 0.05 0.7719 0.6984 0.7167 0.9029 0.06 0.7017 0.7453 0.6072 0.9270 0.04 0.8070 0.6667 0.7119 0.8612 CNN 03/02/1998 50% 0.7357 0.8803 0.05 0.7544 0.6898 0.7218 0.9037 0.06 0.6959 0.7484 0.6468 0.9274 0.04 0.8012 0.7062 0.7638 0.8727 60% 0.6821 0.9409 0.05 0.7602 0.7558 0.7051 0.9190 0.06 0.6667 0.7917 0.6470 0.9265 0.04 0.6535 0.4049 0.6372 0.8789 40% 0.8770 0.7324 0.05 0.5940 0.4800 0.5960 0.9046 0.06 0.1287 0.5909 0.6990 0.9096 0.04 0.6436 0.4710 0.6677 0.8445 CNN 22/02/1998 50% 0.8511 0.9100 0.05 0.5742 0.5088 0.6073 0.9041 0.06 0.5148 0.5252 0.6000 0.9425 0.04 0.6238 0.5122 0.6515 0.8409 60% 0.8285 0.9624 0.05 0.5544 0.5544 0.6205 0.9165 0.06 0.4752 0.6076 0.6004 0.9474 0.04 0.7328 0.5454 0.7166 0.8184 40% 0.8728 0.7553 0.05 0.6641 0.5918 0.6523 0.8415 0.06 0.6412 0.6885 0.6274 0.9001 0.04 0.7099 0.5886 0.7260 0.8206 CNN 15/05/1998 50% 0.8516 0.8486 0.05 0.6565 0.6056 0.6547 0.8562 0.06 0.6183 0.6807 0.6219 0.8923 0.04 0.6870 0.6475 0.7248 0.8163 60% 0.7880 0.9330 0.05 0.6259 0.6406 0.6469 0.8670

0.06

0.04 0.5833 0.5431 0.6667 0.7705 40% 0.8914 0.7619 0.05 0.5000 0.5400 0.6448 0.8821 0.06 0.4722 0.5795 0.5701 0.9099 0.04 0.6111 0.6055 0.6664 0.7865 CNN 31/05/1998 50% 0.8774 0.8974 0.05 0.5185 0.5714 0.6499 0.8920 0.06 0.4815 0.6046 0.5760 0.9182 0.04 0.6204 0.6569 0.6861 0.7825 60% 0.8468 0.9412 0.05 0.5092 0.6180 0.6584 0.8830 0.06 0.4722 0.6456 0.6088 0.9118 Tabela 5.10: Resultados obtidos pelo Algoritmo 4 sobre z_∩¹(i) com m = 11 no conjunto de testes oriundo do canal de televis˜ao CNN.

5.3. APLICAÇ ÃO: SUMARIZAÇ ÃO DE VÍDEO DIGITAL 73 V´ıdeo k^ψ_corte Rcorte Pcorte kgrad Rgrad Pgrad Rcov Pcov

0.04 0.7404 0.6831 0.6322 0.8922 40% 0.8986 0.9268 0.05 0.6488 0.7944 0.5744 0.9174 0.06 0.5725 0.8152 0.5497 0.9516 0.04 0.7328 0.7111 0.6167 0.8942 ABC 24/02/1998 50% 0.8649 0.9481 0.05 0.6564 0.7963 0.5651 0.9201 0.06 0.5649 0.8222 0.5314 0.9576 0.04 0.6870 0.7692 0.6346 0.9170 60% 0.8446 0.9506 0.05 0.5878 0.8555 0.5854 0.9150 0.06 0.5267 0.8625 0.5374 0.9560 0.04 0.7956 0.6687 0.5820 0.9008 40% 0.9043 0.8455 0.05 0.7080 0.7185 0.5765 0.9346 0.06 0.6569 0.8036 0.5760 0.9634 0.04 0.7810 0.7230 0.6160 0.9079 ABC 12/04/1998 50% 0.8898 0.9136 0.05 0.7008 0.7680 0.5996 0.9406 0.06 0.6496 0.8318 0.6067 0.9631 0.04 0.7591 0.8000 0.6436 0.9093 60% 0.8783 0.9619 0.05 0.7153 0.8596 0.6147 0.9402 0.06 0.6350 0.8877 0.6026 0.9613 0.04 0.8278 0.6367 0.7214 0.8110 40% 0.8712 0.7859 0.05 0.7611 0.7287 0.6850 0.8976 0.06 0.7111 0.8050 0.6885 0.9511 0.04 0.8222 0.7014 0.7729 0.8128 ABC 25/04/1998 50% 0.8576 0.9200 0.05 0.7444 0.7836 0.7687 0.8938 0.06 0.7111 0.8366 0.6872 0.9443 0.04 0.7944 0.7566 0.7685 0.8073 60% 0.8135 0.9562 0.05 0.7055 0.8089 0.7519 0.8897 0.06 0.6667 0.8276 0.6824 0.9460 0.04 0.8189 0.6265 0.7162 0.8635 40% 0.9439 0.9352 0.05 0.7401 0.7460 0.6663 0.9001 0.06 0.6535 0.7477 0.6667 0.9384 0.04 0.8110 0.6867 0.7374 0.8875 ABC 19/06/1998 50% 0.9283 0.9613 0.05 0.7244 0.7541 0.6991 0.9182 0.06 0.6535 0.7615 0.6656 0.9582 0.04 0.7795 0.7279 0.7719 0.8880 60% 0.8941 0.9762 0.05 0.7008 0.7807 0.7289 0.9144 0.06 0.6299 0.8000 0.6979 0.9646 Tabela 5.11: Resultados obtidos pelo Algoritmo 4 sobre z_∩¹(i) com m = 11 no conjunto de testes oriundo do canal de televis˜ao ABC.

74 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS

Figura 5.1: Trecho do sumário constru´ıdo automaticamente para ABC 19/06/1998. Re-ferências (web links) ligam tomadas com conteúdo visual similar.

Cap´ıtulo 6 Conclus˜ oes

Neste trabalho, foi apresentado o problema da segmenta¸cão temporal de tomadas e sua im-portância na estrutura¸cão e indexa¸cão de v´ıdeo digital. As principais propostas de solu¸cão encontradas na literatura foram introduzidas e debatidas. Este estudo se concentrou em me-didas de varia¸cão do conteúdo visual entre quadros do v´ıdeo, baseadas em histogramas de cor.

A principal contribui¸cão, nesse sentido, foi uma revisão do clássico algoritmotwin-comparison (Algoritmo 2 ) de Zhang et al. [ZKS93], propondo uma nova versão aqui chamada de twin-comparison ψ (Algoritmo 4). Tal versão se baseia em máximos locais, encontrados no sinal de varia¸cão do conteúdo visual, e sua distância relativa aos demais valores de sua vizinhan¸ca.

Foi discutido, através de testes com várias seqüências de v´ıdeo, como os parâmetros utiliza-dos pelo algoritmo (limiares, suporte temporal, granularidade do histograma) impactam seu desempenho. Examinou-se, ainda, duas formas diferentes de compara¸cão de histogramas: in-terseçcão entre bins e correla¸cão de histogramas, sendo a primeira medida a que apresentou melhores resultados, como defendido por Gargi et al. [GKS00].

Os resultados apresentados aqui e os encontrados na literatura recente mostram que,

em-75

76 CAPÍTULO 6. CONCLUS ÕES bora a deteçcão de cortes possa obter n´ıveis razoáveis de reconhecimento e precisão para sua aplica¸cão em sistemas de sumariza¸cão de v´ıdeo, a deteçcão de transi¸cões graduais ainda não atinge n´ıveis similares de desempenho. Caracter´ısticas de baixo-n´ıvel, isto é, com pouca in-forma¸cão semântica, tais como distribui¸cão de cor, média e variância de luminosidade, podem assumir comportamentos similares ao longo de transi¸cões entre tomadas, movimenta¸cão de objetos, opera¸cões de câmera ou varia¸cão de luz, entre outras, o que dificulta a caracteriza¸cão correta de cada um desses eventos.

A combina¸cão dessas várias caracter´ısticas na constru¸cão de um delimitador de tomadas pode levar a melhores resultados. Combinar caracter´ısticas oriundas de dom´ınios diferentes, como histogramas (dom´ınio de cor) e varia¸cão entre pixels (dom´ınio espacial) pode ser uma forma de compensar suas deficiências individuais.

Trabalhos recentes como os de Vasconcelos e Lippman [VL00] e Hanjalic [Han02] apontam na dire¸cão de classificadores bayesianos que utilizam não só as distribui¸cões da varia¸cão do conteúdo visual em tomadas e entre tomadas como também probabilidades computadas com base na dura¸cão das tomadas. Tais classificadores podem se mostrar alternativas mais robustas aos inúmeros eventos presentes no decorrer do v´ıdeo e que são fontes de falsos positivos e falsos negativos.

O estudo de solu¸cões bayesianas (e outras abordagens probabil´ısticas), a composi¸cão de caracter´ısticas de baixo-n´ıvel em descritores com maior poder de classifica¸cão e técnicas baseadas em aglomerados¹ são os próximos passos para a continua¸cão deste estudo, bem como a aplica¸cão da delimita¸cão de tomadas em novas ferramentas para navega¸cão de explora¸cão de v´ıdeo digital.

1Do originalclustering.

Referˆ encias Bibliogr´ aficas

[AL96] Gulrukh Ahanger and Thomas D. C. Little. A survey of technologies for parsing and indexing digital video. Journal of Visual Communication and Image Repre-sentation, 7(1):28–43, Mar¸co 1996.

[Ala93] Adnan M. Alattar. Detecting and compressing dissolve regions in video sequences with a dvi multimedia image compression algorithm. Proceedings of IEEE Inter-national Symposium on Circuits and Systems (ISCAS), 1:13–16, Maio 1993. 20, 41

[BB82] D. .H Ballard and C. M. Brown. Computer Vision. Prentice-Hall, New Jersey, NY, 1982. 28

[BB95] S. S. Beauchemin and J. L. Barron. The computation of optical flow. ACM Computing Surveys, 27(3), Setembro 1995. 29

[BDBP02] Marco Bertini, Alberto Del Bimbo, and Pietro Pala. Indexing for reuse of tv news shots. Pattern Recognition, 35:581–591, Mar¸co 2002. 1

[BDF⁺99] P. Bouthemy, Y. Dufournaud, R. Fablet, R. Mohr, S. Peleg, and A. Zomet.

Content-based browsing and navigation. InEuropean Workshop on Content-Based Multimedia Indexing CBMI’99, Toulouse, France, Outubro 1999. 6

78 REFER ˆENCIAS BIBLIOGR ´AFICAS [BR96] J. S. Boreczky and L. Rowe. Comparison of video shot boundary detection tech-niques. In Proc. IS&T/SPIE Storage and Retrieval for Still Image and Video Databases IV, volume 2670, pages 170–179, Fevereiro 1996. 25, 46

[Can86] John Canny. A computational approach to edge detection. IEEE Transactions on Pattern Analysis and Machine Inteligence, 8(6):679–698, 1986. 29

[CC01] Luciano da Fontoura Costa and Roberto Marcondes Cesar, Jr. Shape Analysis and Classification: Theory and Practice. CRC, 1 edition, 2001.

[CHH⁺00] Shih-Fu Chang, Qian Huang, Thomas Huang, Atul Puri, and Behzad Shahraray.

Multimedia search and retrieval. In Atul Puri and Tsuhan Chen, editors,Advances in Multimedia: Systems, Standards and Networks. Marcel Dekker, New York, 2000.

[DSP91] Glorianna Davenport, Thomas Aguierre Smith, and Natalio Pincever. Cinematic primitives for multimedia. IEEE Computer Graphics and Applications, 11:67–74, Julho 1991. 3, 4

[Eco02] Umberto Eco. Como se Faz uma Tese. Perspectiva, 17 edition, 2002.

[FT98] A. M¨ufit Ferman and A. Murat Tekalp. Efficient filtering and clustering methods for temporal video segmentation and visual summarization. Journal of Visual Communication and Image Representation, 9(4):336–351, Dezembro 1998. 8, 44, 55

[GCAL03] Silvio Jamil Ferzoli Guimarães, Michel Couprie, Arnaldo de Albuquerque Araújo, and Neucimar Jerônimo Leite. Video segmantation based on 2d image analysis.

Pattern Recognition Letters, 24:947–957, 2003. 20

REFER ˆENCIAS BIBLIOGR ´AFICAS 79 [GKS00] Ullas Gargi, Rangachar Kasturi, and Susan H. Strayer. Performance characteriza-tion of video-shot-change deteccharacteriza-tion methods. IEEE Transactions on Circuits and Systems for Video Technology, 10(1):1–13, 2000. 25, 27, 31,37, 46, 75

[GW00] Rafael C. Gonzalez and Richard E. Woods. Processamento de Imagens Digitais.

Edgard Bl?cher, 1 edition, 2000. 29, 30, 44, 46

[Han02] Alan Hanjalic. Shot-boundary detection: Unraveled and resolved? IEEE Transac-tions on Circuits and Systems for Video Technology, 12(2):90–105, fevereiro 2002.

v, 3,4, 6,8, 16, 19,20, 31, 51,52, 76

[HO00] Kien A. Hua and JungHwan Oh. Detecting video shot boundaries up to 16 times faster (poster session). InProceedings of the eighth ACM international conference on Multimedia, pages 385–387. ACM Press, 2000.

[HWJ94] A Hampapur, T. Weymouth, and R. Jain. Digital video segmentation. In Proceed-ings of the second ACM international conference on Multimedia, pages 357–364.

ACM Press, 1994. 13

[IP97] F Idris and S. Panchanathan. Review of image and video indexing techniques.

Journal of Visual Communication and Image Representation, 8(2):146–166, Junho 1997. 25, 26

[IR98] ITU-R. Recommendation bt.470-6. Technical report, International Telecommuni-cation Union, Novembro 1998. 30

[KC01] Irena Koprinska and Sergio Carrato. Temporal video segmentation: A survey.

Signal Processing: Image Communication, 16(5):477–500, Junho 2001. 25

80 REFER ˆENCIAS BIBLIOGR ´AFICAS [KJ91] R. Kasturi and R. Jain. Computer Vision: Principles, chapter Dynamic Vision,

pages 469–480. IEEE Computer Society Press, Washington, DC, 1991. 27 [LdW02] Longin Jan Latecki and Daniel de Wildt. Automatic recognition of unpredictable

events in videos. In International Conference on Pattern Recognition, Qu?bec, Agosto 2002.

[Lie99] Rainer Lienhart. Comparison of automatic shot boundary detection algorithms.

In Proc. IS&T/SPIE Storage and Retrieval for Image and Video Databases VII, volume 3656, pages 290–301, 1999. 25

[Lie01] Rainer Lienhart. Reliable transition detection in videos: A survey and practi-tioner’s guide. International Journal of Image and Graphics, 1(3):469–486, 2001.

[LPE97] Rainer Lienhart, Silvia Pfeiffer, and Wolfgang Effelsberg. Video abstracting. Com-munications of ACM, 40(12):54–62, 1997. v, 3, 4

[MPEG02] MPEG Moving Picture Experts Group. Mpeg-4 overview - (v.21 - jeju version).

Technical report, International Oorganisation for Standardisation, Mar?o 2002. 2 [MPEG03] MPEG Moving Picture Experts Group. Mpeg-7 overview (version 9). Technical

report, International Organisation for Standardisation, Mar?o 2003. 2

[NT92] Akio Nagasaka and Yuzuru Tanaka. Automatic video indexing and full-video search for object appearances (abstract). J. Inf. Process., 15(2):316, 1992. 26, 30 [Pro] The Open Video Project. http://www.open-video.org. v, 5, 12, 17

REFER ˆENCIAS BIBLIOGR ´AFICAS 81 [SFSP01] Chang Shih-Fu, Thomas Sikora, and Atul Puri. Overview of mpeg-7 standard.

IEEE Transactions on Circuits and Systems for Video Technology, 11(6):685–687, Junho 2001.

[Sha95] B. Shahraray. Scene change detection and content-based sampling of video se-quences. In Proceedings of IS&T/SPIE, volume 2419, pages 2–13, 1995. 27 [SLG02] Philippe Salembier, Joan Llach, and Luis Garrido. Visual segmentation tree

cre-ation for mpeg-7 description schemes. Pattern Recognition, 35:563–579, Mar¸co 2002.

[SLS03] Nicu Sebe, Michael S. Lew, and Arnold W. M. Smeulders. Video retrieval and sum-marization: editorial introduction. Computer Vision and Image Understanding, 92(2-3):141–146, Novembro-Dezembro 2003. 4

[TDV00] Ba Tu Truong, Chitra Dorai, and Svetha Venkatesh. New enhancements to cut, fade, and dissolve detection processes in video segmentation. InProceedings of the eighth ACM international conference on Multimedia, pages 219–227. ACM Press, 2000. 42, 52, 55

[UFGB99] Shingo Uchihashi, Jonathan Foote, Andreas Girgensohn, and John Boreczky.

Video manga: Generating semantically meaningful video summaries. In ACM Multimedia 99, Orlando, Florida, Outubro 1999.

[VL97] Nuno Vasconcelos and Andrew Lippman. A bayesian video modeling framework for shot segmentation and content characterization. In Proceedings of the 1997 Workshop on Content-Based Access of Image and Video Libraries (CBAIVL ’97), page 59. IEEE Computer Society, 1997. 20

82 REFER ˆENCIAS BIBLIOGR ´AFICAS [VL00] Nuno Vasconcelos and Andrew Lippman. Statistical models of video structure for content analyis and characterization. IEEE Transactions on Image Processing, 9(1):3–19, Janeiro 2000. 20,76

[XL98] Wei Xiong and John Chung-Mong Lee. Efficient scene change detection and camera motion annotation for video classification. Computer Vision and Image Under-standing, 71(2):166–181, Agosto 1998. vi,37, 39, 40

[XLI95] Wei Xiong, John Chung-Mong Lee, and Man-Ching Ip. Net comparison:a fast and effective method for classifying image sequences. InProc.of SPIE Conference on Storage and Retrieval for Image and Video Databases III, volume 2420, pages 318–328, San Jose, CA, 1995. 27, 28

[YL95] Boon-Lock Yeo and Bede Liu. Rapid scene analysis on compressed video. IEEE Transactions on Circuits and Systems for Video Technology, 5:533–544, Dezembro 1995. 19, 32, 34,36, 52

[ZCPR03] W. Zhao, R Chellappa, P. J. Phillips, and A. Rosenfeld. Face recognition: A literature survey. ACM Computing Surveys, 35(4):399–458, 2003. 6

[ZKS93] HongJiang Zhang, Atreyi Kankanhalli, and Stephen W. Smoliar. Automatic par-titioning of full-motion video. Multimedia Systems, 1(1):10–28, 1993. vi, 8, 26, 27, 30,31, 32, 51,60, 65, 75

[ZMM95] Ramin Zabih, Justin Miller, and Kevin Mai. A feature-based algorithm for de-tecting and classifying scene breaks. Proceedings of ACM Mutlimedia 95, pages 189–200, Novembro 1995. 28

No documento SEGMENTAÇ ÃO AUTOM ÁTICA DE TOMADAS EM VÍDEO THIAGO TEIXEIRA SANTOS (páginas 82-99)