update

3 years ago · c6a176a8d5
1 changed files with 7 additions and 10 deletions
--- a/audio_decoder.py
+++ b/audio_decoder.py
@ -1,10 +1,15 @@
+import soundfile as sf
+import numpy as np
 from typing import Generator, NamedTuple

 import av

 from towhee.operator.base import Operator
+from torch_vggish import TorchVggish

-AudioOutput = NamedTuple("Outputs", [("audio_frame", 'ndarray'), ('simple_rate', 'int'), ("TIMESTAMP", 'int')])
+# from torch_vggish import TorchVggish
+
+AudioOutput = NamedTuple("Outputs", [("audio_frame", 'ndarray'), ('sample_rate', 'int'), ("TIMESTAMP", 'int')])


 class AudioDecoder(Operator):
@ -18,15 +23,7 @@ class AudioDecoder(Operator):
        in_container = av.open(audio_path)
        stream = in_container.streams.get(audio=0)[0]
        for frame in in_container.decode(stream):
-            timestamp = frame.time * 1000
+            timestamp = int(frame.time * 1000)
            sample_rate = frame.sample_rate
            ndarray = frame.to_ndarray()
            yield AudioOutput(ndarray, sample_rate, timestamp)
-
-
-if __name__ == '__main__':
-    d = AudioDecoder()
-    audio_path = '/Users/jiangjunjie/WorkSpace/audio_data/stereo.wav'
-    it = d(audio_path)
-    for data in it:
-        print(data._asdict())